a 当前位置：前瞻网 » 资讯 » 产经

假房源、假照片、假简历，甚至假猫……这群人要把神经网络玩坏了！

分享到：

Winnie Lee • 2019-05-06 17:00:18　来源：前瞻网　E1590G0

595

人工智能越来越擅长对人类“撒谎”。尽管它们还无法说服、故意误导他人，但它们已经能够创造出不存在的声音和图像，看上去还逼真无比。

虚假的人类照片

近日，来自日本的研究人员利用神经网络制作了逼真的高清视频，里面是各种各样穿着衣服的人类图像，但实际上并不存在。

3434

（视频截图）

负责这次令人瞠目结舌的技术演示的公司是DataGrid，一家基于日本京都大学校园的初创公司。

正如视频所示，人工智能算法可以想象出一连串逼真的人类图像，并且衣服和形态能够不断变化。视频中也没有任何图像伪影或奇怪的小毛病，这些“露馅”之处标志着生成图像的尝试失败。

和许多生成式人工智能工具(包括去年佳士得拍卖会上拍出高价的人工智能艺术品)一样，这个最新的演示是使用一种叫做生成式对抗网络(GAN)的工具创建的。

GAN使两个人工神经网络相互竞争。在这种情况下，一个“生成器”网络生成新的图像，而另一个“鉴别器”网络试图找出哪些图像是计算机生成的，哪些不是。随着时间的推移，这个对抗过程让“生成器”网络变得足够擅长创建图像，从而每次都能成功地欺骗“鉴别器”。

不过，这或许也没有想象的那么难，因为视频中的人类处于简单的白色背景中，从而最大限度地减少了可能的背景混乱，这可能会影响创建的图像质量。

这显然是一个令人惊叹的技术进步，但同时也让人有些担忧，有了这样栩栩如生的AI图像，假新闻或许也将变得更加难以分辨。

虚假的人脸

一个名叫ThisPersonDoesNotExist的网站利用对抗神经网络也创造出了非常逼真的虚假人脸。

它利用的是英伟达在去年发布的StyleGAN算法，用真人照片来训练，生成人工合成的类似照片。

34234

（YOUTUBE截图）

英伟达表示，其GAN是围绕一个名为“风格转移”的概念构建的。该系统分析了三种基本风格——粗糙、中等、精细——并将它们透明地融合成一种全新的东西，而不是试图将不同面孔的元素复制粘贴到一个怪人身上。

“粗糙”包括姿势、脸型或发型等参数。“中等”包括面部特征，如鼻子、脸颊或嘴巴的形状。最后，“精细”选项会影响面部特征的颜色，比如皮肤和头发。科学家们表示，为了消除与新合成人脸无关的噪声，该发生器还“能够从高级属性中分离出无关紧要的变化”。

例如，它可以区分发型和真实的头发，消除前者，而应用后者的最终照片。它还可以指定如何应用样式来获得或多或少微妙的效果。

英伟达的系统不仅能够生成全新的合成人脸，还能无缝地修改真人的特定特征，比如年龄、头发或肤色。这样一个系统的应用是惊人的。比如，人们可以准确地在做发型之前就预览发型的变化。

ThisAirBNBDoesNotExist网站的创始人克里斯托弗•施密特(Christopher Schmidt)在接受采访时说:“我之所以对这个ThisPersonDoesNotExist感兴趣，是因为我不明白这样的东西怎么可能行得通。”

“我想，这个模型肯定是需要某个模板来制作图像的。当我发现它不是——它真的能够接受任何随机的输入集，并将其转换成一张真实的脸的图像时，我大吃一惊。我完全承认，我仍然不明白它是如何工作的，但我明白它确实能做到，这是一个有趣的领域。”

Airbnb虚假房源

Airbnb房源是另一个被网友们用来“调戏”的东西。ThisAirBNBDoesNotExist网站能够自动生成不存在的Airbnb房源图片，每次刷新都会出现一个虚假的房源，网页上的照片、文字描述、发布人头像均由计算机自动生成。

由于使用的模型非常简单，文字描述多有不合逻辑之处，但乍看上去还是能以假乱真。

3434

（网络截图）

根据制作者Christopher Schmidt 在 Twitter 的介绍，生成每个网页用一块 GPU 只需 0.5 秒。

他表示，这个网站在构建图片和卧室照片时使用 StyleGAN算法，一些文本网络的训练使用了tf.keras 来生成地点名称、房主姓名、标题和描述。所有的数据训练过程都在谷歌的Colab上完成，该平台上可以免费使用GPU和TPU来训练和生成数据。

每个模型都可以做出独立的预测，所以会经常出现各部分信息不相配的情况，比如描述信息中说某套房子有一间卧室，但列表信息中显示有四间卧室，或者外观和名字排列不齐等。

虚假的抽象派画作

Reddit上一位网友利用StyleGAN训练生成了999幅抽象派画作。在数据方面，采用的是Kaggle上名为”Painter by Numbers“项目中的数据集，其中大部分的图像数据来源于http://WikiArt.org网站。

其中，只采用了≥1024X2014的图像。在GTX 1080 TI上的训练时间大约是5天。

不过作者表示，该模型试图生成人脸的部分并不是很完美，但其它部分还算可以。

虚假的二次元角色

无限生成二次元妹子的网站也是利用StyleGAN算法制作的。这个网站能够自动生成二次元角色。

“我考虑了内在的娱乐因素、高质量的可用性、数据和机器学习的真正困难等众多因素，然后挑选了二次元角色。”ThisWaifuDoesNotExist网站的创始人Gwern Branwen称。

“这并不是你在许多已发表的论文中都能看到的东西，而是每个人都能欣赏的东西：不好的结果很有趣，而好的结果甚至更有趣。”

虚假的猫、简历和初创公司

此外，还有网站能够自动生成不存在的猫咪图片，虽然其中有些看起来有点诡异。此外还有网站能够生成虚假的简历，甚至是虚假的初创公司网页。

3434

（图：虚假的猫）

3434

（图：虚假的简历）

3434

（图：虚假的初创公司网页）

英伟达将StyleGAN算法开源后，不少人都利用它来做出了各种好玩的效果，其中最臭名昭著的就是“Deepfake”，它将一些女明星的脸“拼接”到色情演员身上。

除了以上这些例子，还有虚假的汽车、食物等等基于 StyleGAN 模型的“造假成果”，如雨后春笋一样不断涌现。甚至有人把这些“造假成果”汇总到了一个网站，叫“这些东西都不存在”。

这些类似的“造假”网站背后的技术都是一样的，网站的大致布局也一样，允许用户重复刷新，每次都提供100%的新图片。

虽然这引发了人们的担忧，但值得注意的是，完成这一任务需要在8个英伟达Tesla图形处理器上进行为期一周的人工智能培训，每个处理器的成本高达数千美元——而这些不是随随便便能办到的事情。

前瞻产业研究院

咨询专线：400-068-7188

扫一扫下载APP

与资深行业研究员/经济学家互动交流让您成为更懂趋势的人

24小时排行周排行

假房源、假照片、假简历，甚至假猫……这群人要把神经网络玩坏了！

相关深度报告 REPORTS

前瞻经济学人

前瞻产业研究院

相关阅读RELEVANT

前瞻产业研究院

问答榜单 ＋更多

w上市数据 ＋更多

假房源、假照片、假简历，甚至假猫……这群人要把神经网络玩坏了！

相关深度报告 REPORTS

前瞻经济学人

前瞻产业研究院

相关阅读RELEVANT

前瞻产业研究院

问答榜单 ＋更多

w上市数据 ＋更多

问答榜单＋更多

w上市数据＋更多