A前瞻官网
前瞻网
a 当前位置: 前瞻网 » 资讯 » 产经

DeepSeek以低成本直追OpenAI!李彦宏:历史上的创新与降低成本有关,大模型推理成本每年降低90%以上【附大语言模型发展现状】

分享到:
 趋势速递 • 2025-02-12 19:18:15 来源:前瞻网 E11891G4
100大行业全景图谱

DeepSeek以低成本直追OpenAI!李彦宏:历史上的创新与降低成本有关,大模型推理成本每年降低90%以上

(图片来源:摄图网)

2月11日,在阿联酋迪拜举办的 World Governments Summit 2025 峰会上,百度创始人李彦宏与阿联酋 AI 部长展开对谈,其间关于AI领域创新、成本及投资的深刻见解,为我们打开了洞察当下AI发展的新窗口。

谈及DeepSeek时,李彦宏表示,回顾过去几百年的历史,创新的本质是成本下降与生产力提升。不仅在AI领域或IT行业,大多数创新都与降低成本有关。如果成本降低一定比例,生产力也随之提高同样比例。我们生活在一个非常激动人心的时代。在过去,当我们谈论摩尔定律时说,每18个月性能会翻倍、成本会减半;但今天,当我们谈论大语言模型时,可以说每12个月,推理成本就可以降低90%以上。这比我们过去几十年经历的计算机革命要快得多。

DeepSeek以低成本直追OpenAI后,引发了华尔街对AI基建投资的广泛质疑。对此,李彦宏称,“当技术发展如此之快,你无法停止投资。你必须投资,以确保处于这场技术创新或革命的最前沿。”虽然有可能找到一条低成本的捷径,但在这之前可能会花费数十亿美元用于探索不同的路径。

在谈及大语言模型竞争时,李彦宏强调模型间差距体现在能力、成本、推理速度等多维度,评估关键在于是否满足用户需求带来价值增益。关于开源模型和商业模型,李彦宏认为开源模型虽看似低成本,但不会解决算力问题,用户需自担设备费用,而商业模型因用户基数大,能分摊研发成本,效率更高,大型商业机构在竞争中优势明显。他还提出大模型开发需持续投入和快速迭代,保持至少六个月竞争优势。

大规模语言模型(Large Language Models,LLM),也称大语言模型或大型语言模型,是一种由包含数百亿以上参数的深度神经网络构建的语言模型,通常使用自监督学习方法通过大量无标注文本进行训练。自2018年以来,Google、OpenAI、Meta、百度、华为等公司和研究机构都相继发布了包括BERT,GPT-3等在内的大语言模型,随后几年来,大语言模型呈现爆发式的增长。

国内外主要大语言模型研发路径与技术对比

在大语言模型(LLMs)的全球竞技场中,ChatGPT与Google的Gopher、LaMDA,以及Meta的Llama等构成了国际标杆,而国内则由百度的“文心一言”、360的大语言模型、阿里的“通义千问”和商汤的“商量”等引领潮流。从对话和文本生成能力的角度,ChatGPT暂居优势,但这并非因为技术壁垒不可逾越。实际上,Google等国外企业因战略和技术理念选择了不同的发展路径,这是其暂时落后的主因。随着新技术的不断涌现,赶超ChatGPT并非不可能。相对而言,百度等国内企业在数据集、计算能力和工程化方面存在短板,短期内难以实现对国外模型的迎头赶上,这更多地需要国内AI产业全链条的协同进步。

在影响大语言模型性能的因素方面,训练数据、模型规模(即参数数量)、生成算法和优化技术被认为是核心变量。然而,如何准确量化这些因素对模型性能的具体影响,目前还处于探索阶段,没有明确的结论。总体来看,世界顶级的大语言模型在技术层面上尚未拉开明显的差距。

图表4:截至2024年国内外主要大语言模型研发路径与技术对比

百川智能、清华智谱、阿里巴巴综合领先

根据SuperCLUE最新发布的大语言模型排行榜,国内大模型中,百川3、GLM-4、通义千问2.1以综合得分73.32、72.58、72.45依此居于行业第一、二、三名。腾讯混元-pro、文心一言4.0、MoonShot(Kimichat)紧随其后。

图表2:截至2024年4月SuperCLUE大语言模型评分总排行榜TOP10

一线城市大语言模型产业氛围良好

我国大语言模型产业链分布主要集中在北京、上海、深圳、广州、杭州等经济发达的一线城市、新一线城市中,截至2023年11月,根据前瞻不完全统计,全国已有130个左右的大语言模型产品,其中,北京已有54个大语言模型公司,上海市有12个,深圳市11个,杭州市8个,广州4个,成都3个,南京3个,其他地区11个。总体来看,大语言模型产业链分布呈现明显的区域化特征,主要聚集在经济发达地区。

图表3:截至2023年中国大语言模型相关公司区域分布数量(单位:家)

OpenAI首席科学家 Ilya Sutskever表示,大语言模型是通向通用人工智能(AGI)的重要途径。他认为,随着模型规模的不断扩大和训练数据的持续丰富,大语言模型将展现出更为强大的理解和生成能力,能够处理复杂的自然语言任务,甚至在某些领域超越人类的表现。

前瞻经济学人APP资讯组

更多本行业研究分析详见前瞻产业研究院《全球及中国多模态大模型行业发展前景与投资战略规划分析报告

同时前瞻产业研究院还提供产业新赛道研究投资可行性研究产业规划园区规划产业招商产业图谱产业大数据智慧招商系统行业地位证明IPO咨询/募投可研专精特新小巨人申报十五五规划等解决方案。如需转载引用本篇文章内容,请注明资料来源(前瞻产业研究院)。

更多深度行业分析尽在【前瞻经济学人APP】,还可以与500+经济学家/资深行业研究员交流互动。更多企业数据、企业资讯、企业发展情况尽在【企查猫APP】,性价比最高功能最全的企业查询平台。

相关深度报告 REPORTS

2025-2030年全球及中国多模态大模型行业发展前景与投资战略规划分析报告
2025-2030年全球及中国多模态大模型行业发展前景与投资战略规划分析报告

本报告前瞻性、适时性地对多模态大模型行业的发展背景、供需情况、市场规模、竞争格局等行业现状进行分析,并结合多年来多模态大模型行业发展轨迹及实践经验,对多模态大...

查看详情

本文来源前瞻网,转载请注明来源。本文内容仅代表作者个人观点,本站只提供参考并不构成任何投资及应用建议。(若存在内容、版权或其它问题,请联系:service@qianzhan.com) 品牌合作与广告投放请联系:0755-33069875 或 hezuo@qianzhan.com

p34 q4 我要投稿

分享:
标签: DeepSeek 李彦宏

品牌、内容合作请点这里:寻求合作 ››

前瞻经济学人微信二维码

前瞻经济学人

专注于中国各行业市场分析、未来发展趋势等。扫一扫立即关注。

前瞻产业研究院微信二维码

前瞻产业研究院

如何抓准行业的下一个风口?未来5年10年行业趋势如何把握?扫一扫立即关注。

前瞻经济学人 让您成为更懂趋势的人

想看更多前瞻的文章?扫描右侧二维码,还可以获得以下福利:

  • 10000+ 行业干货 免费领取
  • 500+ 行业研究员 解答你的问题
  • 1000000+ 行业数据 任君使用
  • 365+ 每日全球财经大事 一手掌握
  • 下载APP

  • 关注微信号

前瞻数据库
企查猫
前瞻经济学人App二维码

扫一扫下载APP

与资深行业研究员/经济学家互动交流让您成为更懂趋势的人

下载APP
前瞻经济学人APP

下载前瞻经济学人APP

关注我们
前瞻经济秀人微信号

扫一扫关注我们

我要投稿

×
J