人工智能越来越擅长对人类“撒谎”。尽管它们还无法说服、故意误导他人,但它们已经能够创造出不存在的声音和图像,看上去还逼真无比。
虚假的人类照片
近日,来自日本的研究人员利用神经网络制作了逼真的高清视频,里面是各种各样穿着衣服的人类图像,但实际上并不存在。
(视频截图)
负责这次令人瞠目结舌的技术演示的公司是DataGrid,一家基于日本京都大学校园的初创公司。
正如视频所示,人工智能算法可以想象出一连串逼真的人类图像,并且衣服和形态能够不断变化。视频中也没有任何图像伪影或奇怪的小毛病,这些“露馅”之处标志着生成图像的尝试失败。
和许多生成式人工智能工具(包括去年佳士得拍卖会上拍出高价的人工智能艺术品)一样,这个最新的演示是使用一种叫做生成式对抗网络(GAN)的工具创建的。
GAN使两个人工神经网络相互竞争。在这种情况下,一个“生成器”网络生成新的图像,而另一个“鉴别器”网络试图找出哪些图像是计算机生成的,哪些不是。随着时间的推移,这个对抗过程让“生成器”网络变得足够擅长创建图像,从而每次都能成功地欺骗“鉴别器”。
不过,这或许也没有想象的那么难,因为视频中的人类处于简单的白色背景中,从而最大限度地减少了可能的背景混乱,这可能会影响创建的图像质量。
这显然是一个令人惊叹的技术进步,但同时也让人有些担忧,有了这样栩栩如生的AI图像,假新闻或许也将变得更加难以分辨。
虚假的人脸
一个名叫ThisPersonDoesNotExist的网站利用对抗神经网络也创造出了非常逼真的虚假人脸。
它利用的是英伟达在去年发布的StyleGAN算法,用真人照片来训练,生成人工合成的类似照片。
(YOUTUBE截图)
英伟达表示,其GAN是围绕一个名为“风格转移”的概念构建的。该系统分析了三种基本风格——粗糙、中等、精细——并将它们透明地融合成一种全新的东西,而不是试图将不同面孔的元素复制粘贴到一个怪人身上。
“粗糙”包括姿势、脸型或发型等参数。“中等”包括面部特征,如鼻子、脸颊或嘴巴的形状。最后,“精细”选项会影响面部特征的颜色,比如皮肤和头发。科学家们表示,为了消除与新合成人脸无关的噪声,该发生器还“能够从高级属性中分离出无关紧要的变化”。
例如,它可以区分发型和真实的头发,消除前者,而应用后者的最终照片。它还可以指定如何应用样式来获得或多或少微妙的效果。
英伟达的系统不仅能够生成全新的合成人脸,还能无缝地修改真人的特定特征,比如年龄、头发或肤色。这样一个系统的应用是惊人的。比如,人们可以准确地在做发型之前就预览发型的变化。
ThisAirBNBDoesNotExist网站的创始人克里斯托弗•施密特(Christopher Schmidt)在接受采访时说:“我之所以对这个ThisPersonDoesNotExist感兴趣,是因为我不明白这样的东西怎么可能行得通。”
“我想,这个模型肯定是需要某个模板来制作图像的。当我发现它不是——它真的能够接受任何随机的输入集,并将其转换成一张真实的脸的图像时,我大吃一惊。我完全承认,我仍然不明白它是如何工作的,但我明白它确实能做到,这是一个有趣的领域。”
Airbnb虚假房源
Airbnb房源是另一个被网友们用来“调戏”的东西。ThisAirBNBDoesNotExist网站能够自动生成不存在的Airbnb房源图片,每次刷新都会出现一个虚假的房源,网页上的照片、文字描述、发布人头像均由计算机自动生成。
由于使用的模型非常简单,文字描述多有不合逻辑之处,但乍看上去还是能以假乱真。
(网络截图)
根据 制作者Christopher Schmidt 在 Twitter 的介绍,生成每个网页用一块 GPU 只需 0.5 秒。
他表示,这个网站在构建图片和卧室照片时使用 StyleGAN算法,一些文本网络的训练使用了tf.keras 来生成地点名称、房主姓名、标题和描述。所有的数据训练过程都在谷歌的Colab上完成,该平台上可以免费使用GPU和TPU来训练和生成数据。
每个模型都可以做出独立的预测,所以会经常出现各部分信息不相配的情况,比如描述信息中说某套房子有一间卧室,但列表信息中显示有四间卧室,或者外观和名字排列不齐等。
虚假的抽象派画作
Reddit上一位网友利用StyleGAN训练生成了999幅抽象派画作。在数据方面,采用的是Kaggle上名为”Painter by Numbers“项目中的数据集,其中大部分的图像数据来源于http://WikiArt.org网站。
其中,只采用了≥1024X2014的图像。在GTX 1080 TI上的训练时间大约是5天。
不过作者表示,该模型试图生成人脸的部分并不是很完美,但其它部分还算可以。
虚假的二次元角色
无限生成二次元妹子的网站也是利用StyleGAN算法制作的。这个网站能够自动生成二次元角色。
“我考虑了内在的娱乐因素、高质量的可用性、数据和机器学习的真正困难等众多因素,然后挑选了二次元角色。”ThisWaifuDoesNotExist网站的创始人Gwern Branwen称。
“这并不是你在许多已发表的论文中都能看到的东西,而是每个人都能欣赏的东西:不好的结果很有趣,而好的结果甚至更有趣。”
虚假的猫、简历和初创公司
此外,还有网站能够自动生成不存在的猫咪图片,虽然其中有些看起来有点诡异。此外还有网站能够生成虚假的简历,甚至是虚假的初创公司网页。
(图:虚假的猫)
(图:虚假的简历)
(图:虚假的初创公司网页)
英伟达将StyleGAN算法开源后,不少人都利用它来做出了各种好玩的效果,其中最臭名昭著的就是“Deepfake”,它将一些女明星的脸“拼接”到色情演员身上。
除了以上这些例子,还有虚假的汽车、食物等等基于 StyleGAN 模型的“造假成果”,如雨后春笋一样不断涌现。甚至有人把这些“造假成果”汇总到了一个网站,叫“这些东西都不存在”。
这些类似的“造假”网站背后的技术都是一样的,网站的大致布局也一样,允许用户重复刷新,每次都提供100%的新图片。
虽然这引发了人们的担忧,但值得注意的是,完成这一任务需要在8个英伟达Tesla图形处理器上进行为期一周的人工智能培训,每个处理器的成本高达数千美元——而这些不是随随便便能办到的事情。
本报告前瞻性、适时性地对人工智能行业的发展背景、供需情况、市场规模、竞争格局等行业现状进行分析,并结合多年来人工智能行业发展轨迹及实践经验,对人工智能行业未来...
品牌、内容合作请点这里:寻求合作 ››
想看更多前瞻的文章?扫描右侧二维码,还可以获得以下福利:
下载APP
关注微信号
扫一扫下载APP
与资深行业研究员/经济学家互动交流让您成为更懂趋势的人
违法和不良信息举报电话:400-068-7188 举报邮箱:service@qianzhan.com 在线反馈/投诉 中国互联网联合辟谣平台
Copyright © 1998-2024 深圳前瞻资讯股份有限公司 All rights reserved. 粤ICP备11021828号-2 增值电信业务经营许可证:粤B2-20130734