新的AI骗术!用声音就可伪造出嘴形ㄧ致的影片

时间:2020-07-13

新的AI骗术!用声音就可伪造出嘴形ㄧ致的影片

PS 的使用让图片可以以假乱真,人像去背重置到另一个场所的「骗术」层出不穷,不过你能想像在未来只要用声音就可以做出伪造的影片吗? 最近华盛顿大学的研究人员开发了一项新工具,透过新的机器学习演算法,可以将音档转换成口型一致的影片。如下方影片,左边为音档,右边是透过人工智慧将声音转换为欧巴马口型所生成的影片,虽然似乎有那幺一点对不上,不过整体来说已经相当的逼真!

影片来源:UW

事实上,使用 AI 伪造的概念在之前就有类似的工具,像是 Twitter 机器人 Smile vector ,可以将明星艺人的照片做成微笑的动图。Adobe 的 Project VoCo 可像

在过去,类似的技术所使用的概念为录製多个人反覆说同一句话的影片,再收集声音与不同口型之间的相关性。 不过此技术十分耗时,成本也非常昂贵。而在这次研究他们转换了技术,所使用的技术不只是将音档提供给神经网路,同时也提供影片进行训练。

团队表示,使用欧巴马作为测试的原因在于,欧巴马的高画质影片素材丰富,可让神经网路训练更加容易,研究人员 Ira Kemelmacher 表示这次大约需要 17 个小时的镜头来追蹤并複製嘴形动作,但在未来这个训练的时长可降为 1 小时。

他们希望在未来可将此技术应用来改善像是 Skype 视讯聊天工具,使用者可以收集自己的音档用来训练软体。由于透过网路传输音档所需频宽远低于视讯,因此,在网路不稳又需要与对方视讯对谈时,就能自动使用自己的声音生成视讯,同时也可以解决断网后造成影片遗失而无法存取的问题。

然而这样的工具,让人担心未来在影片上更容易产生造假的问题,不过研究团队表示,他们对于这样的问题也会十分谨慎,因此在未来他们也将开发可以辨别视讯真伪的工具!

相关推荐