图源:摄图网
近日,OpenAI告诉《金融时报》,他们发现了一些模型蒸馏的证据,他们怀疑这是DeepSeek的所作所为。目前,OpenAI拒绝进一步置评,也不愿提供证据细节。
具体来说,他们发现了DeepSeek“蒸馏”OpenAI模型的迹象。即使用更大模型的输出来提高较小模型的性能,从而以较低成本在特定任务上取得类似结果。
微软也开始调查DeepSeek是否使用OpenAI的API。
各方消息汇总来看,微软和OpenAI对DeepSeek的质疑还处于调查中。根据微软工作人员的说法,DeepSeek可能在去年秋天调用了OpenAI的API,这可能导致数据泄露。
按照OpenAI的服务条款规定,任何人都可以注册使用OpenAI的API,但是不能使用输出数据训练对OpenAI造成竞争威胁的模型。
而对于模型蒸馏,在行业内,一些开源模型的服务条款允许蒸馏。比如Llama,DeepSeek此前也在论文中表示使用了Llama。
IBM对知识蒸馏的文章中也提到,大多数情况下最领先的LLM对计算、成本提出太高要求……知识蒸馏已经成为一种重要手段,能将大模型的先进能力移植到更小的(通常是)开源模型中。因此,它已经成为生成式AI普惠化的一个重要工具。
而DeepSeek R1并非只是简单蒸馏模型,OpenAI首席科学家Mark Chen表示:DeepSeek独立发现了OpenAI在实现o1过程中所采用的一些核心理念。同时他也认可了DeepSeek在成本控制上的工作,并提到蒸馏技术的趋势,表示OpenAI也在积极探索模型压缩和优化技术,降低成本。
所以总结一下,模型蒸馏技术在学术界、工业界都非常普遍且被认可,但是违反OpenAI的服务条款。
就在OpenAI挑起矛盾的同时,Anthropic也下场了。
创始人Dario Amodei在个人博客中表达了对DeepSeek的看法。
他表示并没有把DeepSeek看做是竞争对手,认为DS最新模型的水平和他们7-10个月前相当,只是成本大幅降低。同时他还认为,DeepSeek整个公司的成本投入(非单个模型训练成本)和Anthropic的AI实验室差不多。
2024年全球大模型行业市场规模将达到280亿美元
大模型是指包含超大规模参数(通常在十亿个以上)的神经网络模型。神经网络模型则是指基于神经网络结构构成的数学模型,它受到人脑神经系统结构的启发,由人工神经元(节点)和它们之间的连接组成。这些连接具有权重,可以通过学习过程进行调整,从而使得神经网络能够学习和适应输入数据的模式。2023年全球大模型行业市场规模达到210亿美元。初步估算,2024年全球大模型行业市场规模将达到280亿美元,未来五年复合增速将达到36.23%。
区域市场
从区域市场来看,根据斯坦福大学人工智能研究所(Stanford HAI)于2024年4月发布的《2024年人工智能指数报告》,2019-2023年全球基础大模型发布累积数量中,数量最多的国家是美国,2023年美国发布了基础大模型109个,占比达69%,其次是中国和英国。
产业竞争
当前全球AI大模型行业正处于技术创新与商业化加速推进的阶段。OpenAI、Google、微软等美企处于领先地位,主导生成式AI、自然语言处理等领域,模型如GPT系列和PaLM广泛应用。Meta等公司探索开源模式,增强生态影响力。行业趋势包括模型规模扩张、多模态能力提升和垂直领域优化,但高计算成本与安全性挑战仍是主要问题。
那么DeepSeek R1的价值究竟几何?
分析师郭明錤最新博客给出参考:
一是在Scaling Law放缓的情况下,AI算力仍可透过优化训练方式持续成长,并有利挖掘新应用。
过去1-2年,投资者对AI服务器供应链的投资逻辑,主要基于AI服务器的出货量在Scaling Law依然有效的情况下可持续增长。但Scaling law的边际效益开始逐渐递减,市场开始关注以DeepSeek为代表的通过Scaling law以外的方式显著提升模型效益的路径。
第二个趋势是API/Token价格的显著下滑,有利于加速AI应用的多元化。
郭明錤认为,目前从生成式AI趋势中获利的方式,主要还是“卖铲子”和降低成本,而不是创造新业务或提升既有业务的附加值。
而DeepSeek-R1的定价策略,会带动生成式AI的整体使用成本下降,这有助于增加AI算力需求,并且可以降低投资人对AI投资能否获利的疑虑。
不过,使用量的提升程度能否抵消价格降低带来的影响,仍然有待观察。
同时,郭明錤表示,只有大量部署者才会遇到Scaling law边际效益的放缓,因此当边际效益再度加速时,英伟达将依然是赢家。
前瞻经济学人APP资讯组
更多本行业研究分析详见前瞻产业研究院《2024-2029年全球及中国大模型产业发展前景与投资战略规划分析报告》
同时前瞻产业研究院还提供产业新赛道研究、投资可行性研究、产业规划、园区规划、产业招商、产业图谱、产业大数据、智慧招商系统、行业地位证明、IPO咨询/募投可研、专精特新小巨人申报、十五五规划等解决方案。如需转载引用本篇文章内容,请注明资料来源(前瞻产业研究院)。
更多深度行业分析尽在【前瞻经济学人APP】,还可以与500+经济学家/资深行业研究员交流互动。更多企业数据、企业资讯、企业发展情况尽在【企查猫APP】,性价比最高功能最全的企业查询平台。
本报告前瞻性、适时性地对大模型产业的发展背景、供需情况、市场规模、竞争格局等行业现状进行分析,并结合多年来大模型产业发展轨迹及实践经验,对大模型产业未来的发展...
品牌、内容合作请点这里:寻求合作 ››
想看更多前瞻的文章?扫描右侧二维码,还可以获得以下福利:
下载APP
关注微信号
AI圈炸了!“AI教母”李飞飞团队用不到50美元训练出新模型,性能叫板OpenAI和DeepSeek【附大语言模型发展现状】
电视开机率跌至30%!日本松下官宣放弃电视机业务,集中力量发展AI,社长:电视机不再赚钱,我们必须做出改变【附电视机行业现状分析】
OpenAI重磅官宣:向所有用户开放ChatGPT搜索功能,无需注册即可用!网友感叹谷歌时代要结束了【附大语言模型行业现状分析】
实习生都可月薪过万!DeepSeek百万年薪招聘AI人才,创始人梁文锋谈招聘标准:偏好应届生【附全球大模型发展现状分析】
紧急上线!OpenAI再推新智能体Deep Research,称远远超过DeepSeek R1【附中国生成式AI行业前景】
扫一扫下载APP
与资深行业研究员/经济学家互动交流让您成为更懂趋势的人
违法和不良信息举报电话:400-068-7188 举报邮箱:service@qianzhan.com 在线反馈/投诉 中国互联网联合辟谣平台
Copyright © 1998-2025 深圳前瞻资讯股份有限公司 All rights reserved. 粤ICP备11021828号-2 增值电信业务经营许可证:粤B2-20130734