在训练人工智能模型时,怎么样让它在掌握扎实的词汇和词类基本知识后,进一步了解语法?
以下面这句话为例:“厨师跑去饭店吃饭”。这句话有许多元素,该怎么理解?是厨师去吃饭,还是饭店吃饭,抑或是厨师开的商店在吃饭?
普通人基本上能顺接理解这句话的意思,但即使是最先进的人工智能系统,也会对此感到困惑。毕竟,从这句话中截取一部分,就是“饭店吃饭”。
过去让先进的机器学习模型解决这些问题,主要是通过大量人工数据训练,工程师“手把手”地教授语法、句法和其他语言原理。
问题是,这种方法昂贵且需要大量人力,且仍然难以教会计算机处理一些含糊不清的问题。在实际语言中,根据句子结构和语境的不同,同一组词的意义可能有很大的不同,中文尤其如此。
但斯坦福大学人工智能研究人员的2项新研究发现,先进的人工智能系统也可以自行摸索出语言原理,不必预先练习人类标注的数据。这种方法更接近于人类儿童学习语言的方式。更令人惊讶的是,研究人员还发现,人工智能模型似乎还能推断出适用于不同语言的“通用”语法关系。
这对自然语言处理有很大的影响,而这种语言处理在回答问题、翻译语言、帮助客户甚至审查简历的人工智能系统中越来越重要。
这种方式成功的关键是让机器参与数十亿个“疯狂填词”(Mad Libs)游戏。欧美曾流行的一种群体游戏,共同编造一个故事,故事内容可以随想象力无限发散。人工智能模型可以以此学到很多关于语言的知识。在这个过程中,为了更好地预测缺失的单词,他们会自动创建单词的相互关系模型。
这些模型变得更大、更灵活的过程,实际上就是在自我组织,最终逐渐发展成人类语言的结构。这和人类儿童的思维很相似。
译/前瞻经济学人APP资讯组
参考资料:
[1]https://techxplore.com/news/2020-07-ai-mad-libs-grammar.html
品牌、内容合作请点这里:寻求合作 ››
想看更多前瞻的文章?扫描右侧二维码,还可以获得以下福利:
下载APP
关注微信号
扫一扫下载APP
与资深行业研究员/经济学家互动交流让您成为更懂趋势的人
违法和不良信息举报电话:400-068-7188 举报邮箱:service@qianzhan.com 在线反馈/投诉 中国互联网联合辟谣平台
Copyright © 1998-2024 深圳前瞻资讯股份有限公司 All rights reserved. 粤ICP备11021828号-2 增值电信业务经营许可证:粤B2-20130734