A前瞻官网
前瞻网
a 当前位置: 前瞻网 » 资讯 » 大咖

徐冰谈人工智能:算法商业化,AI产业落地速度超你的想象

分享到:
 徐冰 • 2017-03-01 09:35:47 来源:笔记侠 E1176G0
100大行业全景图谱

商汤科技联合创始人徐冰

徐冰 | 商汤科技联合创始人

本文来源于微信公众号:笔记侠

微信ID:Notesman

编辑:笔记侠

活动:2017年2月16日,由大数据垂直科技媒体数据猿联合中欧工商学院、腾讯直播共同举办《中欧微论坛|数据猿·超声波》,笔记侠作为合作媒体,经主办方和讲者审阅授权发布笔记。PPT来自嘉宾。

笔记之前,请先思考:

人工智能为什么火起来?

背后的技术支撑是什么?

行业应用情况如何?

怎样带来效益的增长?

完整笔记·人工智能

今天跟大家分享一下我们在深度学习方面是怎么做的,比如说超算、数据,这些东西怎么做得比人做得好;另外,我们做到超过人之后,现在已经在哪些行业里用起来了?服务了什么地方?比如,安防监控、金融、互联网机器人已经在用,到底怎么用?哪些地方用了以后能够带来效益的增长?

一、人工智能为什么火起来?

人工智能概念被提出来,是为了提高效率、降低成本,相当于代替人,提高生产力,然后解放劳动力。这件事情如果实现,有非常大的商业价值,就像当年蒸汽机被发明出来后,交通、纺织这些行业都被颠覆了。

以往,我们看到人工智能的三起两落,人工智能这个概念很早以前就很火了,60年代其实就有两拨人工智能热,当时有很多科学研究人员说人工智能时代到来了,但后来很快冷下来了,为什么?根本原因是实际上技术的精度还没有达标,跟人相比还差很远,一些商家买了之后发现没什么用,就不继续买了,也不推荐,很快就冷下来了。

2

现在的这一拨为什么火起来了?

人工智能在大众范围被关注恐怕还是因为阿尔法狗和世界围棋冠军下围棋,赢了世界冠军,这次的震撼,不仅对大众很大,而且对行业震撼也很大,主要是阿尔法狗在下围棋过程中,有几步是没有逻辑的,同时,阿尔法狗的进程显示,在下这几步时,还是显示要赢的概率,就是说这几步虽然没有逻辑,但阿尔法狗并没有迷茫,这说明阿尔法狗对下这几步是心里有数的,但我们却弄不明白它这么下的理由,这一点让科学家都非常困惑和震撼。

另外,人工智能各种产品出来后,体验很好,尤其是机器人,商家买了之后,原来100个人做这个事情,现在用50个人就可以做,去年发展的情况远远超出了我们的想象,落地的速度非常快。到2017年后,我们将看到越来越多的企业安排更多的预算去采购算法,或者自己组建团队,做业务上的升级,等等。从这批人的反馈变化,我们发现这拨热潮很难冷下来。

技术本身是从人的大脑、生理学角度上有一些观测,之后用数学的模式建模,在大量的数据之上去归纳总结数据里面的一些规律,最终能够让机器学习到某一项技能,比如说下围棋是一项技能,围棋这件事情不仅仅只是在围棋上,实际上它超过了人(这里指阿尔法狗下围棋战胜人类这件事上,阿尔法狗不仅是在数据算法上超过了人,它可能在智能上超过了人。——笔记侠注),还有2014年的人脸识别。2011年,我们建立了全球范围之内第一支大规模做深度学习的华人团队。2014年,让我们的技术成功获得了IDG的投资。

1

除了人脸以外,像图像分类,通用物体的分类,人的误差是5%,技术现在最低的误差已经到2%到3%。同时,大量的互联网公司,包括像滴滴、优步都投入到自动驾驶上,开始教机器怎么去开车。

在语言的理解、翻译方面,去年谷歌做到了一个重大的突破,包括生命科学、DNA的一些分析。我们看到深度学习的通用性非常强,用在各个领域里面,看似不相关的技术上都产生了效益,带来了具体技能的应用。当它做到接近人或者超过人的水平的时候,希望能用到行业里面,帮助提高这个行业的生产效率。

大数据计算性能,再加上本身算法上的同时成熟,带来这一波新的商机。比如,我们解决图像的处理,包括像视频里面的内容解析等等这样一系列的问题。

2

算法本身依然处在高速发展期,这有一个非常典型的案例:

在200类的物体识别方面,随便一张照片里面的辨识,什么样的物体在什么样的位置?你可以看到完全不受控的,这是一件非常难的任务。2013年,200类物体22%的检出率。但是现在到了43%的精度,提升了一倍。同期,我们的算法识别检出率高出了7个点,过了一年以后,微软研发的一个网络,又高出来十几个点,到现在,最新的结果又比微软高了6个点。

这件事情在学术界以前是绝对不可能发生的,2010年以前,每一项技术的精度,一年提升一到两个点已经很了不起了,很多语音识别的技术,离99%的还差很远,那个时间点,大家都看不到所谓的人工智能会在什么时候成熟?

但是像现在的一些算法,一年之内可以提升5到10个点这样的一个速度,相当于之前10年的一个积累。算法的提升上,目前也是处在刚刚开始的状态,还有很大的空间。

做深度学习的企业,一个核心的竞争力并不是说我在当前的时间点上算法领先,而是如何保持持续的算法领先。因为你今天领先,可能明天就会被别人超过,你要有原创的能力,持续改进你的算法,再去超过别人。

超算端也需要实实在在的投入,比如现在做深度学习,你必须做GPU超算,用一台服务器或者普通GPU为主的集群,根本没有办法适配这种训练。2014年没有这样的集群,那时候想做人脸识别,20万图片影像,一个月只有一次结果。

3

现在同样的计算,我们上到两千万的计算量,六千万的计算量,可以有不同的网络结构,不同的参数去尝试最后的结果好坏,所以这都离不开集群,集群带来性能上的提升是数百倍,上千倍的效益。这件事情保证了你的算法能够高速的迭代和提升。

第三块其实就是数据,说到这里,其实我也想简单讲讲,中国在数据上有比较大的优势,我们在获取数据这个端口,很多时候是用算法置换去做的。我给你做算法,你有一个义务,持续提供我们合同期内所有的相关数据用于算法的研究和性能上的提升,这个事情就是相互支持。

这三块都叫做基础设施层的投入,然后再到应用层,我们用这些基础设施层的投入去研发应用,比如说图像的理解和搜索算法等等,跟我们的客户需求有直接相关性的一些算法。这些算法放到行业里面,就帮助解决这个行业里面某一个环节,原来是密集劳动力,现在用人工智能算法提高效率,像安防行业,通过统一深度学习平台,一套共用成本研发出来的算法组合在一起,推出一套解决方案。针对金融行业,可能就是另外一个组合再推出一套解决方案,你会发现这里面20、30%的模组都是共用的。

二、行业开始成规模运用的案例

我们再去看已经在这些行业里面开始成规模用起来的一些技术,比如说这一项,大家在路上走路,头上都顶着标签。这项技术在去年之前,技术精度低到没有人去用。

4

这是一个非常复杂场景,一个十字路口,所有的机动车、人,所有的检测和追踪,他们的属性标签:

比如说这是一辆什么颜色的车?

什么型号的车?

车牌是什么?

这个人是男人女人?

成年人还是小孩?

这样的一些属性给记录下来,这有什么价值?

记录下来之后方便检索,公安破案的时候不需要像过去一样,几千名民警把所有区域的监控拷空,回家一人几百小时自己看。存储效率的提升,以及你在真正去判断有没有异常的事件,包括事后破案的时候有一些实际的需求。

1

这个场景是在上海外滩,出现踩踏之后,大家都在想有没有一种算法可以每时每刻监控这个场景人数,当人数一旦有超标的趋势,就派人去线下疏导人流,这个就是基于深度学习去理解场景里面有多少人,每时每刻做一个实时的计数。

2

这一项也是非常典型的应用,在一些关键位置,比如说电梯口、通道部署一个摄像头,把拍到所有人的人脸抓下来之后,跟黑名单做一个比对,如果有罪犯在里面就报警。

换一个场景,放在酒店,放在机场,实际上就是说,有一个白名单,全部都是VIP、高级客户,高净值客户,识别出现他之后,就要针对这些高端客户服务,那就变成一套VIP识别系统。

3

再比如说,现在摄像头在100米开外的距离有没有可能也能够识别出你是谁来?对应一些产品,比如说100米之外对人的识别,对车的识别,以及最整个广场,100乘100这样一个区域的高效监控,广场里面发生什么样事情的识别,比如有一波人在聚集,每一个人抓下来之后跟黑名单做一个比对,全部自动化完成。

刚刚那些例子就在讲,跟大家日常的人身安全,包括跟政府破案,公安破案相关的效率上的具体价值和提升点。

在金融领域,我们找到非常有价值的提升点,就是身份认证这个环节,去银行、金融公司服务的时候,首先要认证你的身份,认证你的身份才能借给你钱,以往这个环节是靠肉眼去看的。这个事情本身就有误差,这是第一方面,第二方面就是消耗人力。

现在移动互联网这么发达,我们手机就可以开户。现在这个技术成熟了,互联网金融公司以借贷宝为代表,一年实现了一亿的增长,如何保证这一亿全部都是实名制的客户,包括银行。这一类金融类机构大概认证了1.6亿到两亿人。

1

另外一类通信,移动运营商去年有一个国家要求的指标,必须要完成未实名制的手机卡。去年,中国移动用这个算法做了3亿人卡的认证。这个技术已经被规模用起来,可能很多人用过,可能很多人还没有接触到,但包括像乐视,在它的帐号里面,通过刷脸就可以登录。

三、技术带来商业效益的增长

商业里面也有,现在讲消费升级,如何去获取线下的消费信息?比如说什么样的人对什么产品感兴趣?过去很难知道。现在基于视觉识别,我可以知道什么类别的人,男人、女人、成年人、小孩在什么区域停留多长时间?什么店铺去了多少次?这样可以收集上来,我可以在线上做一些分析。

2

当然这项技术本身相当于带来用户体验上的改善,比如说在拍照的时候,模糊的照片进行一个处理,这些实际上都是背后基于深度学习技术,去学习如何把有问题的照片恢复回来。

比如说现在还有一项很火的应用,如何用手机的双摄像头原理,能够拍出3D的照片,能够模拟出来单反的拍照算法。一个简单手机就可以拍出大光圈的单反效果,这其实背后全部都是深度学习算法。

还比如说拍到照片内容,因为一个识别理解,然后做智能相册,你的个人照片分为一类你太太的照片分为一类,小孩的照片分为一类,现在小米和华为已经全部上线这项技术,包括微博。去年也有一些年轻人喜欢用的产品,增强现实。大量的直播平台都在上线这个东西。

当然我们看到有一些更加前瞻性的、颠覆性的技术也在研发过程之中,比如无人驾驶。无人驾驶是一个非常复杂的场景,像剧烈的光线变化,非常暗的天,没有路灯打开,像下雪的天气,你要保证算法具有一个比较强的稳定性,所以这个场景是非常难做的。另外像人机交互,机器人也很火,但是机器人怎么跟你交互,你摆出来一些姿态之后,它要理解你。这里面也是要有非常精准的算法。

遥感,前面几位嘉宾也分享了,所有的遥感照片,卫星拍到的照片,都是人标的,把位置标出来,但是现在这些标记已经完全机器替代了。一个标记员标记北京市需要9天时间,但是一个算法9个小时就可以完成。

4

我们看到商业模式上也不难,无非是说用SAAS服务,API的服务,把这个算法做到芯片里面,按照芯片的出货量收费,这些是比较传统的2B技术提供、技术输出的收费模式。但我们看到AI带来的经济效益远远不止于此,我服务一个遥感类的技术标记服务,它可以降低90%成本,提升30%的利润。

这一类的场景下,投资是非常好的结合方式,已经知道用技术验证了,可以帮助利润或者收入提升30%到50%,应该提前投资它,甚至可以提供控股它。控股了这个企业以后,它将提升了一个亿、两个亿的利润。

这是我的分享,谢谢大家!

本文来源笔记侠,内容仅代表作者本人观点,不代表前瞻网的立场。本站只提供参考并不构成任何投资及应用建议。(若存在内容、版权或其它问题,请联系:service@qianzhan.com) 品牌合作与广告投放请联系:0755-33069875 或 hezuo@qianzhan.com

p13 q0 我要投稿

分享:

品牌、内容合作请点这里:寻求合作 ››

前瞻经济学人微信二维码

前瞻经济学人

专注于中国各行业市场分析、未来发展趋势等。扫一扫立即关注。

前瞻产业研究院微信二维码

前瞻产业研究院

如何抓准行业的下一个风口?未来5年10年行业趋势如何把握?扫一扫立即关注。

前瞻经济学人 让您成为更懂趋势的人

想看更多前瞻的文章?扫描右侧二维码,还可以获得以下福利:

  • 10000+ 行业干货 免费领取
  • 500+ 行业研究员 解答你的问题
  • 1000000+ 行业数据 任君使用
  • 365+ 每日全球财经大事 一手掌握
  • 下载APP

  • 关注微信号

前瞻数据库
企查猫
前瞻经济学人App二维码

扫一扫下载APP

与资深行业研究员/经济学家互动交流让您成为更懂趋势的人

下载APP
前瞻经济学人APP

下载前瞻经济学人APP

关注我们
前瞻经济秀人微信号

扫一扫关注我们

我要投稿

×
J