A前瞻官网
前瞻网
a 当前位置: 前瞻网 » 资讯 » 大咖

科大讯飞胡郁:如果机器人能有6岁儿童的逻辑水平将出现爆发式增长

分享到:
 胡郁 • 2016-08-24 09:48:12 来源:混沌研习社 E1661G0
100大行业全景图谱

1

对于人类来说,最愉快的阶段是0-6岁的童年,但是这是机器人最艰难的阶段。在混沌AI成长营的课堂上,科大讯飞轮值总裁胡郁带来了《从“能听会说”到“能理解会思考”——以语音和语言为入口的认知革命》课程分享。

胡郁说,人类的常识是机器人不可逾越的坎,一旦机器人越过了这个坎,达到6岁儿童的常识和逻辑推理能力,后面的知识累积,几乎是可以瞬间完成的东西。

本文经混沌研习社(微信公众号:dfscx2014)授权转载,研习社是一所线上商学院,致力为创业公司培养具有互联网思维和全球化视野的创新人才。

演讲者|胡郁

(科大讯飞轮值总裁、研究院院长)

人工智能和机器人是什么关系?大家都知道机器人的历史比人工智能的历史早,它们俩的区别在哪里呢?

很多做机器人的公司会说,人工智能相当于机器人的大脑,是机器人的一部分。其实不是,这两者的定义从某种程度上来说是一样的,都是能够进行感知、认知、决策和执行的人造系统,只是他们解决问题的空间不同。

人工智能存在于一个虚拟的数字世界里面,而机器人从一开始就存在于物理世界中。

我举一个例子,我们要做智慧家庭。如果你是做人工智能的,我想要开二楼的灯,我在一楼说一句话,利用人工智能通过虚拟世界的信息化系统,二楼的灯就开了。

如果你是做机器人的,可能会做一个机器人在物理世界中爬楼上去到二楼给你把灯打开。说起来很有意思,但是两者的思维模式还是有区别的。所以机器人和人工智能将来会越来越紧密,实现逐步的融合。

那么关于人工智能,今天在这里和大家分享两个内容:

1、人工智能的两种实现路径:类脑计算和大数据人工智能。

2、人工智能发展的三个阶段:运算智能、感知智能、认知智能。

大数据人工智能的市场化

有赖于涟漪效应

闭环系统能够实现快速迭代

目前,人工智能有两种不同的主流实现路径:

第一种叫做类脑计算,通过脑科学神经系统的深入研究,最终实现“强人工智能”。

第二种叫做大数据人工智能,充分利用真实大数据和统计机器学习,目前在工业界已经取得了阶段性的突破。

这里重点谈一下后者。

大数据人工智能成功有三大法宝:深度神经网络、真实大数据和涟漪效应。

2

深度神经网络自1957年到现在,经过60年的不断发展,和十年前并没有太大的变化,但是其最大的优点是能够和真实大数据结合,实现基于深度神经网络的机器学习,也叫作深度学习模型。

深度神经网络与真实大数据的结合,成为当前大数据人工智能的主流路径。

除了深度学习模型之外,另一个可以把人工智能推向市场的重要原因,是互联网时代特有的网络效应——基于研究、技术、工程、产品、用户一体化的大闭环优化,我把它起了个名字叫做涟漪效应。

什么是涟漪效应呢?传统我做一个家电,用着不好,我把它推向市场以后它会砸我的牌子。但是互联网时代不是这样的,做出来的东西,不是所有人都能够同时接触到并进行使用。

新技术在人群当中是一圈一圈地扩散,像水滴滴在水面上,产生的涟漪一开始振幅很大(系统误差较大、产品性能不好),随着水波纹的扩展第二圈振幅就开始变小……

这是因为用户数据能够很快回来,系统能够实现快速更新,性能就提升了。当软件或者服务扩散到更大人群的时候,系统已经改进了,扩散越来越大,系统越来越好,当这个扩展到一亿人的时候,刚刚接触到这个产品的人看到的已经是完美的系统,这是涟漪效应。

这也是科大讯飞非常幸运的一个地方。我们刚刚成立公司的时候,移动互联网并不发达,行业内做语音识别的公司都死掉了,因为效果达不到用户要求。

 所以其实我们当时做的产品是“语音合成”。虽然当时我们在全国评测第一的系统效果不是很完美,但是还可以使用,还能卖点钱,但是语音识别就不行了。

后来2009年我去英国开会,看到手机交互已经成为大势所趋了,所以回来我们就改了,开始做面向移动互联网的语音识别系统。2010年5月,我们在第二次中国云计算大会上率先推出了手机语音识别系统,2010年10月份发布了讯飞云和语音输入法。刚开始是正确率只有50%,一年以后就83%,现在是95%,这个数字已经非常高了。

强人工智能的突破

需要脑科学的深度支撑

认知、心理、神经知识必不可少

很多大众看了好莱坞的电影,比如《奥创纪元》之后,都觉得人工智能太恐怖了。其实现在人工智能还处在非常初级的阶段。人工智能的发展我把它分为三个阶段,分别是运算智能阶段、感知智能阶段、认知智能阶段。

比较简单的阶段我们叫运算智能,简单来说就是计算机能存会算。运算和存储人不可能比过机器,人记忆东西绝对记不住一万个四位数,但是机器可以。

稍微复杂一点的阶段叫感知智能。计算机能听能说,能看会认。通过传感器感知并决策,同时执行一些简单的执行和动作,比如自动驾驶汽车,它并不需要太复杂的高级认知能力。

最难的阶段叫认知智能。计算机能理解,会思考。认知智能是一件比较难的事情,要投入很多力量去做自然语言理解、语言表达、逻辑推理和自我学习。

所以真正要实现“强人工智能”的话,一定是需要了解大脑研究的最新进展,综合认知课学、心理学、神经科学、脑科学的各方面的前沿知识,最终实现人工智能的全面突破。

人类的常识是人工智能难以逾越的坎

一旦机器具有6岁儿童的逻辑推导能力

人工智能将会迅速超越人类智力

我们着重再说一下三个阶段中,最难的认知智能。如何解决语言理解、知识表示、逻辑推理和联想学习这些问题呢?我给出一个认知智能的框架:

一个是自然语义描述。词向量表达是自然语义描述最核心的问题。

3

原来我们进行语义表达的表达方式叫“离散表达”。用数字的0和1来表达汉字比如,大=10000,家=01000,好=00001。这种表达方式的缺点是将单词完全独立分开,忽视单词之间的联系。

现在我们做什么呢?我们现在采用基于Word Embedding的“词向量连续空间嵌入式表达”。通过这种方式我们发现关联度高的词汇自动聚合在一起,比如猫、狗、动物是一个区,唐朝、宋朝、明朝是一个区,皇后、国王、公主是一个区。

利用这种距离度量方式,我们可以得到这样一个等式:皇帝-皇后=男人-女人。目前我们已经取得了比较好的结果,国际上也处于比较领先的地位。

第二叫做语言理解和生成。

首先我们看一个人类关注度模型的例子。人在看图片的时候,分配给每个地方的注意力都是不一样的,人的注意力会有侧重。

4

比如右上方。女性司机开车的时候,只能留意到离她最近的车辆或者行人,难以做到眼观六路,耳听八方。

再看体育新闻。 你看的时候会关注中间“巴塞罗那客场8比0”等等,你会潜意识地关注最核心的部分。

根据人脑的这个特点,我们制作了关注度模型。它的特点是,根据你输入的内容,它自动判断你输入的哪一个变量和结果是强相关的。

这个在文本翻译里非常容易理解。比如“我是谁?”翻译成“Who am I?”这里的我和I是对应的,这是根据强相关,自动生成的结果。

基于这个原理,我们推出了基于关注度神经网络的篇章评阅。比如输入一篇文章,自动找到文中的排比和引用,根据数据库中以往的海量数据,来判断这句话表达是否优美,表达得好就加分,直接转化成这篇文章的得分和评语,这种评分可以说比人工判分更为准确,因为它不会受到因疲劳或者情绪带来的误判。

第三是知识表达和推理,比如阅读理解。

5

假设阅读理解中需要填入一个漏掉的单词,我怎么来判断?计算单词和文章之间的关注度,然后总结出里面所有词汇的热力图,选出最有可能的那个词,放入答案,准确率还是蛮高的。

现在人工智能模型阅读理解的答题能力可以达到6岁儿童。可能大家觉得这是不是太弱了,只是达到了小孩子的理解水平?

所以我这里再多讲一个概念,在认知智能发展的过程中有一个非常重要的点。

对于人类来说,最愉快的时候是0-6岁,不用上学整天玩,认知智能包括常识的理解逐步形成。6岁以后就痛苦了,要学大量的知识。但是机器人正好是相反的,0-6岁是机器人最痛苦的时候,人类的常识对机器人来说是不可逾越的坎。

但是一旦机器人越过了这个坎,达到6岁儿童的常识和逻辑推理能力,后面的知识累积,几乎是可以瞬间完成的东西。所以对于机器人来说,能够达到六岁的常识判断的智商是非常厉害的,也是一个质变的拐点。

本文来源混沌研习社,内容仅代表作者本人观点,不代表前瞻网的立场。本站只提供参考并不构成任何投资及应用建议。(若存在内容、版权或其它问题,请联系:service@qianzhan.com) 品牌合作与广告投放请联系:0755-33069875 或 hezuo@qianzhan.com

p38 q0 我要投稿

分享:

品牌、内容合作请点这里:寻求合作 ››

前瞻经济学人微信二维码

前瞻经济学人

专注于中国各行业市场分析、未来发展趋势等。扫一扫立即关注。

前瞻产业研究院微信二维码

前瞻产业研究院

如何抓准行业的下一个风口?未来5年10年行业趋势如何把握?扫一扫立即关注。

前瞻经济学人 让您成为更懂趋势的人

想看更多前瞻的文章?扫描右侧二维码,还可以获得以下福利:

  • 10000+ 行业干货 免费领取
  • 500+ 行业研究员 解答你的问题
  • 1000000+ 行业数据 任君使用
  • 365+ 每日全球财经大事 一手掌握
  • 下载APP

  • 关注微信号

前瞻数据库
企查猫
前瞻经济学人App二维码

扫一扫下载APP

与资深行业研究员/经济学家互动交流让您成为更懂趋势的人

下载APP
前瞻经济学人APP

下载前瞻经济学人APP

关注我们
前瞻经济秀人微信号

扫一扫关注我们

我要投稿

×
J