a 当前位置：前瞻网 » 资讯 » 产经

影视创作神器！英伟达携手MIT放大招打造迄今最强高清视频生成AI

分享到：

Evelyn Zhang • 2018-08-21 09:30:15　来源：前瞻网　E1871G0

来自英伟达和MIT的研究团队，最近打造出了迄今最强的高清视频生成AI。

英伟达的研究人员开发了一种基于深度学习的系统，可以从每秒30帧的视频中生成高质量的慢动作视频。据称，这种方法已经超越其他同类的现有方案，可以让影视行业的创作者们更流畅地完成电影创作。

前瞻经济学人

（图源：TechEBlog）

研究人员在年度计算机视觉和模式识别（CVPR）会议上展示了这一成果。

只要一幅动态的语义地图，你就可以获得和真实世界几乎一模一样的视频。换句话说，只要把你心中的场景勾勒出来，不用去实拍，电影级的视频就可以自动P出来。

使用NVIDIA Tesla V100 GPU和cuDNN加速的PyTorch深度学习框架，该团队在超过11,000个日常和体育活动视频中训练他们的系统，每秒240帧。经过训练，卷积神经网络预测了额外的帧。

“尽管可以用手机拍摄每秒240帧的视频，但以高帧速率录制所有内容是不切实际的，因为它需要大容量存储空间，并且对移动设备来说，耗电量实在太大。”该团队解释道。

该团队使用单独的数据集来验证其系统的准确性。他们使用了序列生成器和多尺度鉴别器来训练神经网络。生成器接收输入映射和前序帧，然后生成中间帧和Flow map。Flow map用于处理前序帧，然后与中间帧合并，从而生成最终帧。视频鉴别器接收Flow maps以及相邻帧以确保时间一致性。

前瞻经济学人

（图源：Nvidia）

结果可以使以较低帧速率拍摄的视频看起来更流畅，更不模糊。

“我们的方法可以产生多个空间和时间相干的中间帧，”研究人员说。 “我们的多帧方法始终优于最先进的单帧方法。”

在创作的视频中，街景中的道路、车辆、建筑、绿植都可以自动生成，画面非常生动真实——而创作者只需提供大概的轮廓画面，简直不能更神奇！

前瞻经济学人

此外，创作者还可以利用这一平台生成各种不同风格的视频，并临时改动画面内容，比如——把道路两侧的建筑全都变成树木。

前瞻经济学人

在人物描绘方面，更是可以通过一个简单的素描草图，就能生成细节丰富、动作流畅的高清人脸，而人物的各种设置也是可以随机更换的。

前瞻经济学人

这个团队，包括来自英伟达的Ting-Chun Wang、刘明宇（Ming-Yu Liu），以及来自MIT的朱俊彦（Jun-Yan Zhu）等。研究团队还给出了详细的训练指南，可以算是手把手教你如何自己训练出一个类似的强大神经网络。

本文来源前瞻网，转载请注明来源。本文内容仅代表作者个人观点，本站只提供参考并不构成任何投资及应用建议。（若存在内容、版权或其它问题，请联系：service@qianzhan.com）　品牌合作与广告投放请联系：0755-33069875 或 hezuo@qianzhan.com

p40 q0 我要投稿

标签：英伟达 MIT 高清视频 AI

品牌、内容合作请点这里：寻求合作 ››

前瞻经济学人微信二维码

前瞻经济学人

专注于中国各行业市场分析、未来发展趋势等。扫一扫立即关注。

前瞻产业研究院微信二维码

前瞻产业研究院

如何抓准行业的下一个风口？未来5年10年行业趋势如何把握？扫一扫立即关注。

让您成为更懂趋势的人

想看更多前瞻的文章？扫描右侧二维码，还可以获得以下福利：

10000+ 行业干货免费领取
500+ 行业研究员解答你的问题
1000000+ 行业数据任君使用
365+ 每日全球财经大事一手掌握

下载APP
关注微信号

前瞻产业研究院

咨询专线：400-068-7188

扫一扫下载APP

与资深行业研究员/经济学家互动交流让您成为更懂趋势的人

24小时排行周排行

影视创作神器！英伟达携手MIT放大招打造迄今最强高清视频生成AI

前瞻经济学人

前瞻产业研究院

相关阅读RELEVANT

前瞻产业研究院

问答榜单 ＋更多

w上市数据 ＋更多

影视创作神器！英伟达携手MIT放大招 打造迄今最强高清视频生成AI

前瞻经济学人

前瞻产业研究院

相关阅读RELEVANT

前瞻产业研究院

问答榜单 ＋更多

w上市数据 ＋更多

影视创作神器！英伟达携手MIT放大招打造迄今最强高清视频生成AI

问答榜单＋更多

w上市数据＋更多