算力巨头慌了,中国小团队逆袭,算法才是真王道

时间:2025-12-06   编辑:什么新闻

去年底DeepSeek发布了V3.2系列模型,这件事做得比较低调,不过它的增强版在国际奥赛中全都拿到金牌,就连谷歌Gemini也比不过它,更厉害的是这个模型完全开源了,这种做法确实少见,别人都在闭源赚钱,DeepSeek却选择把核心技术公开出来。

主流大厂这几年忙着拼算力,不断堆数据,模型越做越大,可效果提升起来越来越难,DeepSeek没有走这条路,它选择琢磨长思考、定理证明还有代码优化这些软功夫,参数没加多少,能力反而上去了,标准版就能和GPT-5打平手,成本只有人家的1%到5%,我猜他们团队里一定有几个特别爱研究结构的人,不是光靠砸钱的那种。

开源这种做法确实很厉害,现在全球有七成的人工智能初创公司都在用中国的开源模型做基础,国外那些闭源的公司收入上不去,估值只能靠讲故事来维持,而开源模型让技术变成了大家都能用的公共资源,谁都可以修改、使用、搭建,GitHub上面DeepSeek的下载量占了国内开源模型的六成以上,海外用户用得比国内的还要频繁,这说明在技术能够自由流动的地方,创新才会真正活跃起来。

没人讲清楚它用的具体是什么芯片,但行业内部都明白,如果这真是国产芯片实现的效果,那意义就非常重大,昇腾、海光这类平台如果能真正支撑这样规模的模型,就意味着“算法加国产算力”将成为中国人工智能发展的新方向,听说有两家国际大型公司内部也承认,单纯依靠增加算力的路线已经接近极限,再怎么堆叠硬件也没有太大作用,只能回过头来加强算法的优化工作。

美国那边还在比较谁的模型更大,参数更多,中国这边更实在,关心的是这些技术能不能用,数学题、编程题、逻辑推理这些硬活儿,DeepSeek靠着结构设计就能搞定,不需要千亿参数和万张显卡,这不是天赋异禀,是长期资源紧张逼出来的生存智慧,工程师们知道,巧劲比蛮力管用。

开源生态正在悄悄改变游戏规则,闭源厂商忙着建护城河,开源社区已经把模型放进全球AI基础设施里,以后谁想开发新东西,可能先去GitHub找个开源模型改一改,而不是花钱买许可,创新的主场慢慢从实验室挪到了程序员的电脑上,这变化悄无声息,但影响很大。

上一篇:五部门鼓励地方用“券”为算力、算法、数据提供支持,哪些产业率先受益?     下一篇:算法VS算力——Deepseek引航自动驾驶突围