Meta分享Codec Avatar进展:曾要170个摄像头,现只需一台手机

Meta分享Codec Avatar进展:曾要170个摄像头,现只需一台手机

(映维网Nweon 2022年06月14日)自2019年正式公开介绍旨在创建图片真实感虚拟数字人的Codec Avatar项目以来,Meta就一直在积极探索各种优化方式。在日前公布的一项研究中,团队介绍了一个重要的进展:捕获Codec Avatar曾经需要170+个摄像头的复杂装置,但现在只需一台带RGBD摄像头的智能手机(例如iPhone 12)。

延伸阅读:Meta 50年征途:Codec Avatars,创造逼真虚拟角色

研究人员声称,基于智能手机的扫描过程平均只需要3.5分钟。当然,生成包含所有细节的虚拟数字人需要在一台配置四个高端GPU的机器工作6个小时,但如果部署在产品之中,所述步骤可以发生在云端,而不是用户本地设备。

就自我标志而言,人脸比任何其他属性都要重要,成为了“我是谁”和“谁是我”的关键判断因素。所以,人类对人脸非常敏感。但对于生成图像真实感的虚拟数字人而言,这提出了一个巨大的挑战,因为即便是微小的偏差都会大大减损真实感和沉浸感。

为了克服这一困难,传统手段依赖于广泛的个人特定数据捕获和手动处理。这一过程成本高昂且非常耗时。在过去,要捕获一个Codec Avatar,Meta需要一个配备171个高分辨率摄像头的MUGSY装置。

所以,如何降低捕获要求成为了团队一个亟需攻克的难题。在名为《Authentic Volumetric Avatars from a Phone Scan》的论文中,Meta表示现在只需一台智能手机即可完成逼真的捕获。

从有限数据自动创建Avatar的核心挑战在于prior和evidence之间的取舍权衡。prior需要以一种轻量级的方式补充关于用户外观、几何和运动的有限信息,比如说仅通过手机摄像头,但这一般是以evidence作为代价,亦即真实感减损。

但尽管近年来行业已经取得了长足的进展,但以高分辨率学习人脸的多样性依然具有挑战性。

对长尾进行建模是捕捉个人特质(如特定雀斑、纹身或疤痕)所必需项,并要求具有更高维度的latent空间模型。现代方法能够产生似是而非的人脸幻觉,但无法以逼真的方式再现能够用于识别别人的真实人类。有研究人员通过优化latent空间以外的空间来实现出色的反向重建,但产生了强烈的伪影。

在这项研究中,研究人员打破了prior和evidence之间的取舍权衡,消除了产生非真实存在人类幻觉的能力。相反,他们使用手机数据来表示适应。所述的方法包括三个主要要素:

  • 一种通用prior,根据数百特征的高质量多视图视频语料库进行训练的hypernetwork;
  • 一种根据手机扫描调节模型的配准技术;
  • 一种基于反向渲染的技术,用于根据附加表达数据微调个性化模型。

prior的架构是基于这样一个观察:面部外观和结构的长尾的关键在于最适合直接从人类条件数据中提取,而不是从由低维特征嵌入(Embedding)重新提取的细节。与先前的研究接近,研究人员发现低维嵌入的性能迅速稳定,未能捕获个人特定的特质。相反,他们发现通过增强现有方法,可以使用特定于个人的多尺度‘解结’bias map来忠实地重建特定于一个人的高LOD(Level of Detail)。

这种bias map可以使用U-Net-styre的网络从用户中性扫描的unwarpped纹理和几何生成。通过这种方式,Meta的模型是一种可以接收用户中性面部数据,并以bias map的形式为个性化解码器生成参数的hypernetwork。总之,团队的通用prior和自适应策略能够从一次中性扫描中即时创建高度逼真的虚拟数字人,并只需小量带表情扫描可以生成一个横跨人类表达范围的模型。

团队表示,所述方法改进了手机捕获的Avatar生成技术,并且没有显著增加对用户端的需求。现有的方法可能会产生似是而非的幻觉,但其方法能够产生看起来和动起来都像特定个人的Avatar。

另外,所述模型继承了现有个人特定模型的速度、分辨率和渲染质量,因为它采用了类似的架构和渲染机制。所以,它非常适合交互式帧速率要求较高的应用程序,比如说VR。

研究人员声称,基于智能手机的扫描过程平均只需要3.5分钟。当然,生成包含所有细节的虚拟数字人需要在一台配置四个高端GPU的机器工作6个小时,但如果部署在产品之中,所述步骤可以发生在云端,而不是用户本地设备。

另外,团队坦诚目前的系统无法处理眼镜或长发,仅限于头部,不包括身体其他部位。

相关论文:Authentic Volumetric Avatars from a Phone Scan

所以,要真正实现图像真实感Avartar的民用,Meta依然需要继续努力。在今年4月,Codec Avatar团队负责人亚瑟·谢赫(Yaser Sheikh)曾表示,无法预测它离实际应用尚有多远的距离。然而,他指出在项目开始的时候,团队距离目标实现尚差“十个奇迹”,但他相信现在仅剩“五个奇迹”。

郑重声明:本文内容及图片均整理自互联网,不代表本站立场,版权归原作者所有,如有侵权请联系管理员(admin#wlmqw.com)删除。
(0)
用户投稿
上一篇 2022年6月15日
下一篇 2022年6月15日

相关推荐

  • 大数据时代,Rambus为数据传输做了哪些工作?

    在过去几十年里,PCIe(PCI Express)标准曾风光无限,它凭借高性能、高扩展性、高可靠性和高兼容性,取代了包括AGP和PCI在内的许多内部总线。但随着物联网时代的到来,每…

    2022年6月23日
  • 蔚来手机被曝将走高端路线!预计一年后上市,李斌曾称要像苹果那样每年出一款高端机

    中国经济周刊—经济网讯 据悉,蔚来于8月4日正式成立了蔚来移动科技有限公司。有消息称,原美图移动高级副总裁易炜已加盟蔚来手机团队,担任软件部门负责人。 据悉,蔚来移动科技有限公司企…

    2022年9月18日
  • 爱死机第三季1~9集全剧情解析

      昨晚连夜看完爱,死亡,机器人第三季,整体观感比第二季好太多了。大概是第二季太文艺腔,第三季明显增加了很多火爆的内容。   整体来看,第三季第一集《三个机器人》中规中矩。   荒…

    2022年7月26日
  • α粒子散射实验及原子核模型的提出

    昨天我们谈到了电子的发现,并且知道了电子的发现,说明原子是可以再分的,从而提出了汤姆孙模型(又称梅子布丁模型、枣糕模型、葡萄干布丁模型)。汤姆孙认为原子是球体,带正电的物质均匀地分…

    2022年8月15日
  • 微信有哪些小技巧?

    那些——使用微信的技巧!难得有空,忍不住分享,嘿嘿!以下分析以android系统为例。 相信大家对微信公众号应该不陌生,简言之就是加V账号,他们可以发网页形式的微信,然而,普通微信…

    2022年6月1日
  • 赵本山徒弟们集体“叛逆”,是师傅太自私,还是人性太贪婪?

    拜师学艺是从古到今都有的传统,每个人的成功都离不开恩师的提携与指引。像现在很火的相声团体德云社,团队中的很多人都是年纪轻轻就拜郭德纲为师。而作为中国小品大师的赵本山更是有着自己的团…

    2022年5月12日
  • 开心过好每一天

    #一天中最开心的时刻#一天中,最开心的时刻。早上起来,上完厕所,冲水的时候。饭后,把碗筷收拾好,洗干净放好的时候。冲凉洗澡,衣服洗好,晾出去的时候。拿起手机,发个朋友圈装个逼的时候…

    2022年5月6日
  • java中集合求并集、差集以及交集方法你知道多少?

    服务端开发中,经常做的处理就是数据组装,而数据组装中集合处理算是”出镜率”最高的,今天就来简单聊一下集合中求并集、差集以及交集方法。 实际开发中常用处理方式…

    2022年6月17日
  • 行业人士:苹果 iPhone 14 系列首批备货量约 9000 万台

    IT之家 6 月 28 日消息,据 Digitimes 获得的消息,供应链从业者指出,目前零组件备货已在 6 月中下旬启动,预计应在 9 月上市的第一批 iPhone 14 系列总…

    2022年7月5日
  • iWALK口袋宝皮革版体验:专为苹果打造的轻奢快充体验

    手机总避免不了一个尴尬的话题,那就是充电。每次充电的时候,长长的一条线相当地困扰着我。充电宝和手机几乎是零距离,但仍然少不了一条线来连接。这条线再短也是膈应。最近发现一款充电宝,它…

    2022年6月25日

联系我们

联系邮箱:admin#wlmqw.com
工作时间:周一至周五,10:30-18:30,节假日休息