DeepSeek怎样搅动AI工业?
栏目:公司新闻 发布时间:2025-02-08 08:48
◎记者 刘怡鹤
从ChatGPT、Sora、Kimi、豆包,再到现在的DeepSeek,这些横空降生的年夜模子及其产物,为一日千里的AI年夜模子工业写下要害的注脚。
激发国内外科技巨子跟媒体存眷、全社会都在热议的DeepSeek将怎样影响年夜模子工业的走向?在英伟达股价震动,OpenAI、Meta发生危急感,以及A股“DeepSeek观点股”炽热的背地存在着怎么的逻辑?
上海证券报记者采访阿里云、优刻得等业界、学界专家懂得到,估计往年一季度,将会有更多中国头部公司宣布对标DeepSeek的年夜模子。新一轮AI年夜模子利用高潮的崛起,为我国深刻发展“人工智能+”举动带来新机会。
硬核技巧:软硬一体翻新,效力片面晋升
2024年12月26日,DeepSeek-V3首个版本上线并同步开源,机能比肩闭源模子GPT-4o以及Claude-3.5-Sonnet;2025年1月20日,DeepSeek-R1宣布,机能对标OpenAI o1正式版。
一位头部科技公司专家对记者说,现在年夜模子能够分为基座年夜模子、推理模子、多模态模子、用于科研的模子四种。DeepSeek-V3跟DeepSeek-R1分辨在基座年夜模子跟推理模子上追平了寰球当先的年夜模子。
DeepSeek宣布的论文表现,其模子在开辟进程中采用了一系列软、硬件一体的优化跟翻新,在各个层面实现减速盘算、进步硬件应用效力,终极实现了无效节俭盘算资本。
不外,上述专家也廓清,依据DeepSeek-V3论文得出的557.6万美元本钱额是单次练习本钱,后期的本钱投入不克不及疏忽,并且用来预算的英伟达H800的市场价也存在稳定。“固然不外界以为的那么夸大,但DeepSeek确实将单次练习的本钱下降了20%到40%。”这位专家说。
推理模子是OpenAI宣布o1、o3模子首创的新范式。这类模子象征着不再是一次性输出,而是展现一个思考的进程。
复旦年夜学盘算机迷信技巧学院教学张奇接收记者采访时说,对怎样练习出推理模子,OpenAI多少乎不对外颁布任何信息。自o1模子宣布以来,复现o1是工业界的主要任务。DeepSeek能够说是首个复现胜利的模子,并且其采取的跳过监视微调,直接从强化跟进修开端练习的思绪是一个主要翻新点。
“我国年夜模子工业经由两年阁下的摸索跟开展,对年夜模子的练习有了更深入的懂得,而2024年OpenAI的脚步有所加快。因而从GPT-4到o1的开展中,我国企业的追逐速率放慢,某种水平上这种差距在缩小。”张奇说。
鲶鱼效应:下降利用门槛,重塑行业格式
DeepSeek公司建立于2023年7月,建立一年半来,已不止一次在年夜模子工业中激起了“鲶鱼效应”,对年夜模子价钱、开源闭源门路抉择、竞争格式等均发生了较年夜影响。
张奇以为,现在做年夜模子的公司分为三类,此中第一类是OpenAI、DeepSeek。这类公司因为各种要素领有富余的资金、算力等资本,重要目标是寻求翻新、坚持当先。“假如DeepSeek保持上去,很有可能开拓新的道路,成为引领者。”张奇说。
DeepSeek与OpenAI还存在着开源、闭源道路的差别。华泰证券研讨以为,OpenAI底本凭仗技巧壁垒跟闭源形式在AI范畴盘踞上风,但DeepSeek的开源形式跟低本钱可能下降行业进入门槛,减弱其技巧把持位置。特殊是对依附高额算力投入跟专有模子练习的闭源公司而言,DeepSeek的低本钱、高效力特征可能招致局部市场份额的散失,或迫使其调剂贸易形式。
业内以为,OpenAI面临以后情形可能采用两种方法应答竞争:一种是抉择开源一局部,增加用户散失,参加与其余生态的竞争;另一种是推出更杰出的模子,证实其当先性,从而保持其闭源收费的形式。
阿里云智能科技研讨核心主任安琳对记者说:“开源跟闭源门路,本就不料味着机能差别,而是贸易战略的抉择。不论哪种门路,更主要的是怎样构成可连续的贸易化闭环。年夜模子的才能确实在一直晋升,但也面对着边沿效益下降的瓶颈。只有将后期投入转化为贸易化收入,持续赋能技巧晋升,这项技巧的翻新跟利用才干连续下去。”
第二类是腾讯、阿里、字节跳动、Meta等互联网巨子。这些公司领有充分的资本停止投入,同时其自有生态就有丰盛的利用场景跟需要。
固然现在海内外科技公司尚未宣布对标DeepSeek-R1的模子,但业内估计二三月份会有更多中国头部公司宣布相似的模子。1月29日,阿里宣布通义千问Qwen2.5-Max年夜模子。在多个基准测试中,Qwen2.5-Max比肩Claude-3.5-Sonnet,并多少乎片面超出了GPT-4o、DeepSeek-V3及Llama-3.1-405B。
第三类是包含海内“年夜模子六小虎”(智谱、MiniMax、百川智能、月之暗面、阶跃星斗、零一万物)等在内的创业企业。这些公司依附外部融资,现在已有较年夜的融资金额跟较高的估值。面临DeepSeek如许一个异军崛起的黑马,这些创业公司面对着较年夜的压力跟变数。
克日,A股上市公司麋集发布了接入DeepSeek的新闻,掀起了新一轮摸索年夜模子利用的高潮。比方,收集保险公司奇安信将DeepSeek-R1引入到要挟研判、保险经营、浸透测试跟破绽治理等多场景,实现本钱下降、机能晋升。视觉中国实现了DeepSeek-R1的接入与当地化安排,实现了图片剖析跟懂得上的“一图有万言”,以及搜寻用意剖析与婚配方面的“一图胜万言”。
“DeepSeek的开源形式跟低本钱,下降了利用门槛。我以为从利用的角度来说,DeepSeek-R1的呈现,比o1推出的影响更年夜。”张奇说,全社会开端愈加深入地意识到AI的才能,有了推理才能的加持,年夜模子的幻觉年夜幅下降,用户休会也更好。
“当全社会都在念叨DeepSeek的时间,无疑会减速AI的遍及。这对我国深刻发展‘人工智能+’举动是宏大的机会,AI在制作、医疗、教导、交通、农业等多个范畴都无机会开展强大。”安琳说。
云盘算上市公司优刻得研发总监王晓慧告知记者,自卑模子问世以来,很多公司都实验过营业跟年夜模子的融会。在融会中不少公司发明,原认为无所不克不及的AI,现实上利用的正确率跟精度还达不到营业请求。但DeepSeek出圈后,这些公司开端用DeepSeek停止新的实验,实现相干剖析、推理的营业。
对算力来说,DeepSeek固然经由过程翻新门路减弱了年夜模子练习对高端GPU的依附,但业内共鸣是,将来的算力需要将取决于年夜模子年夜范围利用的推理算力。克日,阿里云、腾讯云、优刻得等云盘算厂商均上架了DeepSeek系列模子,供给了多种安排方法,进一步简化了模子开辟流程。
新浪财经大众号
24小时转动播报最新的财经资讯跟视频,更多粉丝福利扫描二维码存眷(sinafinance)