A前瞻官网
前瞻网
a 当前位置: 前瞻网 » 资讯 » 产经

影视创作神器!英伟达携手MIT放大招 打造迄今最强高清视频生成AI

分享到:
 Evelyn Zhang • 2018-08-21 09:30:15 来源:前瞻网 E1630G0
100大行业全景图谱

来自英伟达和MIT的研究团队,最近打造出了迄今最强的高清视频生成AI。

英伟达的研究人员开发了一种基于深度学习的系统,可以从每秒30帧的视频中生成高质量的慢动作视频。据称,这种方法已经超越其他同类的现有方案,可以让影视行业的创作者们更流畅地完成电影创作。

前瞻经济学人

(图源:TechEBlog)

研究人员在年度计算机视觉和模式识别(CVPR)会议上展示了这一成果。

只要一幅动态的语义地图,你就可以获得和真实世界几乎一模一样的视频。换句话说,只要把你心中的场景勾勒出来,不用去实拍,电影级的视频就可以自动P出来。

使用NVIDIA Tesla V100 GPU和cuDNN加速的PyTorch深度学习框架,该团队在超过11,000个日常和体育活动视频中训练他们的系统,每秒240帧。经过训练,卷积神经网络预测了额外的帧。

“尽管可以用手机拍摄每秒240帧的视频,但以高帧速率录制所有内容是不切实际的,因为它需要大容量存储空间,并且对移动设备来说,耗电量实在太大。”该团队解释道。

该团队使用单独的数据集来验证其系统的准确性。他们使用了序列生成器和多尺度鉴别器来训练神经网络。生成器接收输入映射和前序帧,然后生成中间帧和Flow map。Flow map用于处理前序帧,然后与中间帧合并,从而生成最终帧。视频鉴别器接收Flow maps以及相邻帧以确保时间一致性。

前瞻经济学人

(图源:Nvidia)

结果可以使以较低帧速率拍摄的视频看起来更流畅,更不模糊。

“我们的方法可以产生多个空间和时间相干的中间帧,”研究人员说。 “我们的多帧方法始终优于最先进的单帧方法。”

在创作的视频中,街景中的道路、车辆、建筑、绿植都可以自动生成,画面非常生动真实——而创作者只需提供大概的轮廓画面,简直不能更神奇!

前瞻经济学人

此外,创作者还可以利用这一平台生成各种不同风格的视频,并临时改动画面内容,比如——把道路两侧的建筑全都变成树木。

前瞻经济学人

在人物描绘方面,更是可以通过一个简单的素描草图,就能生成细节丰富、动作流畅的高清人脸,而人物的各种设置也是可以随机更换的。

前瞻经济学人

这个团队,包括来自英伟达的Ting-Chun Wang、刘明宇(Ming-Yu Liu),以及来自MIT的朱俊彦(Jun-Yan Zhu)等。研究团队还给出了详细的训练指南,可以算是手把手教你如何自己训练出一个类似的强大神经网络。

本文来源前瞻网,转载请注明来源。本文内容仅代表作者个人观点,本站只提供参考并不构成任何投资及应用建议。(若存在内容、版权或其它问题,请联系:service@qianzhan.com) 品牌合作与广告投放请联系:0755-33069875 或 hezuo@qianzhan.com

p40 q0 我要投稿

分享:

品牌、内容合作请点这里:寻求合作 ››

前瞻经济学人微信二维码

前瞻经济学人

专注于中国各行业市场分析、未来发展趋势等。扫一扫立即关注。

前瞻产业研究院微信二维码

前瞻产业研究院

如何抓准行业的下一个风口?未来5年10年行业趋势如何把握?扫一扫立即关注。

前瞻经济学人 让您成为更懂趋势的人

想看更多前瞻的文章?扫描右侧二维码,还可以获得以下福利:

  • 10000+ 行业干货 免费领取
  • 500+ 行业研究员 解答你的问题
  • 1000000+ 行业数据 任君使用
  • 365+ 每日全球财经大事 一手掌握
  • 下载APP

  • 关注微信号

前瞻数据库
企查猫
前瞻经济学人App二维码

扫一扫下载APP

与资深行业研究员/经济学家互动交流让您成为更懂趋势的人

下载APP
前瞻经济学人APP

下载前瞻经济学人APP

关注我们
前瞻经济秀人微信号

扫一扫关注我们

我要投稿

×
J