人工智能图片生成技术生成的电工你有没有想过AI其实还可以用来伪造图片、音频乃***视频呢?
千万不要以为人工智能的应用场景人工智能图片生成技术生成的电工,只有无人驾驶、AlphaGo、辅助甚***主导医疗行业等等严肃而高大上的方面。如今,AI在音频视觉领域的“嫁接”声音和嘴型技术,足以让你怀疑所听所看的一切!
这项AI在音频视觉领域的魔幻黑科技来自于美国的华盛顿大学。此项目背后的资助者名单云集了各家大腕——三星,谷歌,Facebook以及Intel。其应用到的技术原理并不难理解。
科学家们先是创造了大规模处理音频文件的工具,紧接着是整个流程内***为关键的一步——创造出真实的口型变化以对应音频内容,达到以假乱真的效果。***后的一步反倒相应简单,只要将这些伪造出的口型变化安排给其人工智能图片生成技术生成的电工他视频中无辜的被恶搞者即可。
通过结合华盛顿大学图像实验室之前研发的新式嘴型合成技术,项目组成员终于可以将嘴型及其纹理移植到现存视频中的人脸上。
由此,我们便能看到说话者一本正经地说出他们连想都没有想过的奇葩场景。
比如说,川普一本正经地宣布“美国和加拿大从明年1月1日起将合并为一个***”。
在视频中,左面图画应用到的声源的原视频,而右面的视频则来自于完全不同的演讲。
研究人员通过算法,成功地把左面中的嘴型移植到了右面的人相中,虽然效果不甚***(如果细心的话,你可以发现奥巴马的嘴部有一些模糊,这是利用AI产生的图像的通病),但总体上已经足可以让不明真相的吃瓜群众信以为真。
项目中的一位研究人员表示,目前他们若想达到视频中展现的较为***的嘴型“移植”,需要足足十七个小时长的视频作为数据来让机器解析、学习。不过在未来技术成熟后,这一过程耗费的时长将大大缩短。
当然,开发该技术的团队希望能扩展其应用场景,比如说用来提升视频聊天软件如Skype的使用体验。
用户们可以自行收集自身讲话时的画面,并将其利用到软件的训练之中,意图解决目前视频通话中声音信号传输良好,图片却模糊得一团糟的情况。若一切发展顺利的话,理想状况是用户完全可以关掉视频画面,软件会自动把语音转化为相应的画面发送给另一端的用户。这将在网络连接糟糕或者是用户想节省流量的情境下大显神威。
当然,从出生那***起,这项技术的伦理道德问题和社会影响会一直处在舆论的漩涡之中。单单该项技术带来的破坏力就已经令人无法忽视,如果再搭配上仅需几分钟音频就能伪造任何人声音的黑科技,不法分子完全可以制作出以假乱真的视频引发骚动或是进行诈骗活动。与此原理类似的其他技术还有改变他人表情,通过寥寥几张图片制作3D人脸模型等等。
华盛顿大学的研究人员也意识到了这一点,生成他们在训练中只使用了奥巴马的声音和视频,尽量与上文提到的灰色应用场景保持距离。
但是在原理上,只要能掌握技巧熟练应用这一黑科技组合,我们可以将任何人的声音移植到任何人的脸上,创造出各种意想不到,以假乱真的视频。
编辑来源于网络
本文链接:http://www.0086ai.com/ai/12452.html 人工智能信息尽在:www.0086ai.com