A前瞻官网
前瞻网
a 当前位置: 前瞻网 » 资讯 » 产经

AI大模型“翻车”!小学数学问题难倒一众“好汉”:分不清大小,业内人士:大模型就是偏科,文科强理科弱【附AI大模型行业现状分析】

分享到:
 研选快讯 • 2024-07-17 20:08:06 来源:前瞻网 E9104G0
100大行业全景图谱

AI大模型

图片来源:摄图网

当前,以大模型为代表的人工智能技术正处于蓬勃发展的阶段。大模型,具有巨大的参数规模和深度学习能力,能够实现更加精确的语言理解、图像识别和智能决策等任务。然而,大模型技术却在一道小学数学问题上“翻了车”,分不清“谁大谁小”。

7月13日,最新一期的《歌手》公布排名,孙楠得票13.8%,外国歌手香缇莫得票13.11%。引发了网友对排名的质疑。不少网友认为13.11%大于13.8%,因此,香缇莫的得票率比孙楠高。随后,关于“13.8和13.11大小比较”话题冲上热搜。

一财网消息,以“9.11和9.9哪个大”为例,经测试,ChatGPT以及目前国内的主流大模型,包括阿里、百度等5家大厂模型,月之暗面等6家AI独角兽的模型。阿里通义千问、百度文心一言、Minimax和腾讯元宝4家大模型答对,其他8家则答错。

结果显示,大部分大模型在问答中都错误地比较了小数点后的数字,认为9.11大于9.9.考虑到数字涉及的语境问题,将其限定为在数学语境下,如ChatGPT这样的大模型也照样答错。

值得注意的是,ChatGPT等大模型出现了胡说八道的现象,在为9.9填补了9.90的零位数后,就得出了正确的回答。这类大模型说胡话的现象,在业界被称为大模型出现幻觉。此前,哈尔滨工业大学和华为的研究团队发表的综述论文认为,模型产生幻觉的三大来源:数据源、训练过程和推理。大模型可能会过度依赖训练数据中的一些模式,如位置接近性、共现统计数据和相关文档计数,从而导致幻觉。此外,大模型还可能会出现长尾知识回忆不足、难以应对复杂推理的情况。

截至发稿,月之暗面回应表示:“其实我们人类对大模型的能力探索——无论是大模型能做到什么,还是大模型做不到什么——都还处于非常早期的阶段。我们非常期待用户在使用中能够发现和报告更多的边界案例(Corner Case),不管是最近的‘9.9和9.11哪个大、13.8和13.11哪个大’,还是之前的‘strawberry有几个r’,这些边界案例的发现,有助于我们增加对大模型能力边界的了解。”

针对大模型答数学题普遍“吃瘪”的问题,有业内人士表示,目前来看大模型的数理能力相对较差的情况在中外都是一样的,“打个比方可以这样讲,大模型就是偏科,文科强理科弱,这个情况在一段时间内也不会得到明显的改善”。

从“AI大模型在小学数学问题上‘翻车’”回看AI大模型行业发展情况:

——AI大模型是一种新的智能计算范式

超大规模智能模型,简称大模型,是近年兴起的一种新的人工智能计算范式。和传统AI模型相比,大模型的训练使用了更多的数据,具有更好的泛化性,可以应用到更广泛的下游任务中。按照应用场景划分,AI大模型主要包括语言大模型、视觉大模型和多模态大模型等。业界典型的自然语言大模型有GPT-3、源、悟道和文心等。视觉大模型也已广泛应用于自动驾驶、智能安防、医学影像等领域。基于多模态大模型的以文生图技术也迅速发展,AI内容生成(AI Generated Content,AIGC)已成为下一个AI发展的重点领域。

图表5:生成式AI训练大模型汇总

——全球生成式AI应用需求分析

根据麦肯锡在2023年4月进行的一项调查,尽管GenAl进入公众视野并不久,但对这些工具的尝试性应用已经相当普遍,受访者们预计这些新能力将改变其所在行业。生成式AI已引起商界人士的兴趣:受访者不分地区、行业和资历等级,人人都在工作中和工作之外尝试使用生成式AI。79%的受访者表示,他们至少在工作中或工作之外接触过生成式AI。22%的受访者表示,他们会在工作中经常使用生成式AI。不同资历受访者的生成式AI使用率非常相似,而从行业和地区来看,技术行业和北美地区受访者的生成式AI使用率最高。

图表2:2023年全球生成式AI产品应用需求调查(N=1684)

——全球生成式AI行业市场规模

随着ChatGPT的火爆出圈,生成式AI成为各行各业关注和热议的话题。全球科技巨头和AI厂商纷纷下场,唯恐错过此番科技盛宴。行业翘楚和媒体将生成式AI浪潮类比昔日的移动互联网机遇,认为它将对全球经济和各个行业带来深远影响,企业也将迎来重大变革机遇,同时,根据Bloomberg Intelligence披露的数据,2023年全球生成式AI市场整体规模约为670亿美元,预计2029年及2032年将分别达到7280亿美元和1.3万亿美元,2022-2032年复合增长率高达42%。

图表5:2020-2032年全球生成式AI应用规模及预测(单位:亿美元)

据世界知名咨询机构麦肯锡报告估计,生成式人工智能(AIGC)最终每年可为全球增加7.3万亿美元的GDP。作为新兴的第四产业,大模型将与第一产业农业、第二产业工业、第三产业服务业一起,将成为推动经济发展的新引擎。作为新的产业增长极,第四产业将深刻改变经济社会各个领域,为生产力发展带来巨大的提升。

星环科技创始人孙元浩认为2024年,或将成为人工智能,特别是生成式AI赋能各行各业的“元年”,智能化应用在各个领域发挥越来越重要的作用,为人们的生活和工作带来更多的便利和创新。其中,大模型发挥了重要的作用。

前瞻经济学人APP资讯组

更多本行业研究分析详见前瞻产业研究院《中国AIGC产业发展前景预测与投资战略规划分析报告》。

同时前瞻产业研究院还提供产业新赛道研究投资可行性研究产业规划园区规划产业招商产业图谱产业大数据智慧招商系统行业地位证明IPO咨询/募投可研专精特新小巨人申报等解决方案。在招股说明书、公司年度报告等任何公开信息披露中引用本篇文章内容,需要获取前瞻产业研究院的正规授权。

更多深度行业分析尽在【前瞻经济学人APP】,还可以与500+经济学家/资深行业研究员交流互动。更多企业数据、企业资讯、企业发展情况尽在【企查猫APP】,性价比最高功能最全的企业查询平台。

相关深度报告 REPORTS

2024-2029年中国AIGC产业发展前景预测与投资战略规划分析报告
2024-2029年中国AIGC产业发展前景预测与投资战略规划分析报告

本报告前瞻性、适时性地对AIGC产业的发展背景、供需情况、市场规模、竞争格局等行业现状进行分析,并结合多年来AIGC产业发展轨迹及实践经验,对AIGC产业未来的发展前景做...

查看详情

本文来源前瞻网,转载请注明来源。本文内容仅代表作者个人观点,本站只提供参考并不构成任何投资及应用建议。(若存在内容、版权或其它问题,请联系:service@qianzhan.com) 品牌合作与广告投放请联系:0755-33069875 或 hezuo@qianzhan.com

p43 q0 我要投稿

分享:

品牌、内容合作请点这里:寻求合作 ››

前瞻经济学人微信二维码

前瞻经济学人

专注于中国各行业市场分析、未来发展趋势等。扫一扫立即关注。

前瞻产业研究院微信二维码

前瞻产业研究院

如何抓准行业的下一个风口?未来5年10年行业趋势如何把握?扫一扫立即关注。

前瞻经济学人 让您成为更懂趋势的人

想看更多前瞻的文章?扫描右侧二维码,还可以获得以下福利:

  • 10000+ 行业干货 免费领取
  • 500+ 行业研究员 解答你的问题
  • 1000000+ 行业数据 任君使用
  • 365+ 每日全球财经大事 一手掌握
  • 下载APP

  • 关注微信号

前瞻数据库
企查猫
前瞻经济学人App二维码

扫一扫下载APP

与资深行业研究员/经济学家互动交流让您成为更懂趋势的人

下载APP
前瞻经济学人APP

下载前瞻经济学人APP

关注我们
前瞻经济秀人微信号

扫一扫关注我们

我要投稿

×
J