在当今数字化快速发展的时代,电子商务已经成为人们日常生活的重要组成部分。然而,传统的在线购物方式虽然便捷,但依然存在许多痛点,特别是在服装购买上。由于尺码、款式以及个人身形的多样化,消费者往往面临着“买了却不合适”的问题。为了解决这一难题,谷歌推出了其增强版AI虚拟试穿工具VTO(Virtual Try-On),为时尚购物带来了全新的变革。
1、谷歌AI虚拟试穿工具VTO的核心技术
VTO是谷歌基于Diffusion(扩散)架构的一种全新的AI模型,名为TryOnDiffusion。相较于以往的技术,TryOnDiffusion的核心在于它能够将服装的细节与模特的身材和姿势完美结合,生成高质量、逼真的图像。
此前,服装虚拟试穿主要依赖于geometric warping(几何变形)技术,这种技术通过对服装图像进行剪切和粘贴,然后对其进行变形以适配身体的轮廓。然而,这种方法很难让衣服妥帖地适应身体,并且会存在一些视觉缺陷,比如错位的褶皱,会让衣服看起来畸形和不自然。谷歌的研究者致力于从头开始生成服装的每个像素,以确保图像的逼真性。
TryOnDiffusion的工作原理是利用一组成对的图片:一张是衣服(或者穿着衣服的模特),另一张是模特本身。每张图片都会被发送到自己的神经网络(U-net),并通过被称为“交叉注意力”的过程来相互共享信息,最终输出新的穿着这件衣服的模特的逼真图像。这种基于图像的Diffusion和交叉注意力的结合技术,构成了TryOnDiffusion模型的核心。
为了生成更加逼真的图像,谷歌在TryOnDiffusion的基础上提出了VTO-UNet Diffusion Transformer(VTO-UDiT)的新训练策略。VTO-UDiT从低分辨率图像开始扩散,并在扩散过程中逐步训练高分辨率图像。这种方法可以确保准确再现褶皱、印花和织物纹理等精细细节,使服装在虚拟试穿中呈现出更为真实的效果。
2、谷歌AI虚拟试穿工具VTO的实现步骤
VTO的实现过程包含多个复杂的步骤,以下是其主要流程:
- 预处理:在预处理步骤中,目标人物从人物图像中被分割出来,创建“无服装RGB”图像。同时,目标服装从服装图像中分割出来,并为人物和服装图像计算姿势。
- Parallel-UNet处理:处理后的信息被输入到128×128 Parallel-UNet(关键步骤),以创建128×128的试穿图像。这个图像再与试穿条件的输入一起作为输入进一步发送到256×256 Parallel-UNet中。
- 超分辨率扩散:256×256 Parallel-UNet的输出内容被发送到标准超分辨率扩散(super resolution diffusion),以创建1024×1024的高分辨率图像。
在整个流程中,最为重要的步骤是128×128 Parallel-UNet的构架和处理过程。在这个步骤中,将与服装无关的RGB和噪声图像输入到顶部的person-UNet中,并将分割后的服装图像输入位于底部的garment-UNet。服装的特征通过交叉注意(cross attention)融合到目标图像之中。人和衣服的姿势首先被送入线性层以分别计算姿势嵌入,然后通过注意力机制将姿势嵌入融合到person-UNet中。
3、谷歌AI虚拟试穿工具VTO的功能与应用
VTO的核心功能在于它能够向顾客展示衣服在不同体型和尺寸的真实模特身上的效果。在虚拟服装试穿中,有许多微妙但对于用户来说至关重要的细节,比如衣服的垂坠、折叠、紧贴、伸展和起皱的效果。VTO不仅在这些细节上表现出色,还能根据不同姿势和体型进行实时调整,生成逼真的试穿图像。
谷歌为了使VTO功能尽可能提供真实的效果并且真的能帮助用户挑选衣服,对这个AI模型进行了大量的训练。谷歌使用了多对图像训练模型,每对图像由两种不同姿势的穿着衣服的模特图组成,例如一个穿着衬衫的人侧身站立的图像和另一个向前站立的图像。通过这种训练方式,模型能够学习到不同姿势下服装的变形规律,从而生成逼真的试穿图像。
在实际应用中,VTO已经被广泛应用到多个时尚品牌中。2024年9月5日,谷歌公司发布了其增强版AI虚拟试穿工具,支持来自Boden、Maje、Sandro、Simkhai和Staud等数百个品牌的数千款连衣裙。用户只需上传自己的照片,就可以看到新衣服在自己身上的穿着效果,大大提升了购物的便捷性和体验。
4、谷歌AI虚拟试穿工具VTO的市场意义与前景
虚拟试穿技术的目的在于消除顾客在购买服装时的疑虑,提高用户满意度。谷歌的VTO工具在这一点上提供了一种有效的解决方案。通过精确的虚拟试穿,顾客可以提前预见服装在自己身上的效果,减少了因尺码不合适而产生的退换货问题,同时也为商家节省了成本。
从市场角度来看,虚拟试穿的市场前景广阔。根据市场研究数据,预计至2025年,虚拟试穿的全球市场规模将达到数十亿美元。这样的趋势不仅体现了消费者的需求,同时也反映出技术创新对于提升购物体验的重要性。
除了服装行业,虚拟试穿技术的应用范围还在不断扩大。例如,在家具行业中,AR(增强现实)技术已经使消费者能够在自己家中虚拟摆放家具,从而选择最合适的风格和颜色。虚拟试穿工具的普及,可能为这些行业的再次转型铺平道路。
5、谷歌AI虚拟试穿工具VTO的局限性与挑战
尽管VTO在虚拟试穿领域取得了显著的成果,但它仍然存在一些局限性和挑战。
首先,在预处理过程中,如果分割图和姿势估计存在错误,可能会导致服装泄漏的瑕疵。不过,近年来这方面的准确性已经大大提高,这种情况并不经常发生。
其次,VTO在展示服装效果时,如果服装的RGB不包含在内,可能无法完全展示身体的某些特征,例如纹身或某些肌肉结构可能会不可见。这在一定程度上限制了VTO的适用范围。
此外,虚拟试穿技术的进一步发展也引发了一些社会伦理的讨论。如何保障用户的敏感信息,避免个人隐私泄露,是谷歌等企业在推广虚拟试穿技术时需要面对的重要问题。
结语——时尚购物新革命
谷歌的AI虚拟试穿工具VTO无疑为时尚购物带来了新革命。它通过先进的技术手段,实现了服装在不同体型和姿势下的逼真展示,大大提高了消费者的购物体验。随着技术的不断完善和市场的逐渐扩大,我们期待能看到更多类似的创新应用,让购物不再是一种烦恼,而是乐趣与便捷的结合。未来,虚拟试穿技术有望在更多领域得到广泛应用,为人们的日常生活带来更多便利和惊喜。
-
商派官方订阅号
-
领取相关报告
近期文章
产品推荐
- 品牌云店新零售商城 品牌连锁O2O新零售商城系统