为什么BAT没能做出DeepSeek

飞艇倍投表计划
栏目分类
你的位置:飞艇倍投表计划 > 新闻动态 > 为什么BAT没能做出DeepSeek
为什么BAT没能做出DeepSeek
发布日期:2025-03-06 01:24    点击次数:158

文 | 蓝媒汇,作者 | 叶二,编辑 | 魏晓

一夜之间,DeepSeek 抢走了几乎所有国产大模型的风头。

过去一年,无论是在 C 端出圈的 Kimi,还是后在居上的豆包,无论是用户日活早早突破 2 亿的文心一言,还是登顶全球开源第一的通义千问,与 DeepSeek 给全球科技圈带来的震动相比,都逊色不少。

这并非是一众国产大模型不给力,而实在是 DeepSeek 太优秀了。

以前国内大厂一直讨论的是,距离 OpenAI 到底有多少年差距,但在 DeepSeeK 这里,却是另一番景象。市场热议的是 DeepSeeK 是否已经干翻了 OpenAI,其所代表的开源路线,已经在倒逼 OpenAI CEO 山姆 · 奥尔特曼进行反思:"我个人认为,在这个问题上我们站在历史的错误一边。现在需要想出一个不同的开源策略。"

DeepSeek 的横空出世,其带来的影响不仅是在行业内,同样也更在 C 端市场。

数据显示,仅仅上线 20 天,DeepSeek 的日活就突破了 2000 万大关,成为全球增速最快的 AI 应用。与之相比,ChatGPT 突破 1500 万大关花了 244 天,而 DeepSeek 仅用了 18 天。上线 20 天后的 DeepSeek 日活已达 2215 万,是 ChatGPT 日活用户的 41.6%,并远超豆包日活用户的 1695 万。

这是一场极其夸张的 AI 风暴,并且跟以往截然不同的是,这是一家真正由中国创业公司主导引发的 AI 风暴。

问题在于,为什么是 DeepSeek?

要知道,过去两年国内主流的互联网大厂都在大模型赛道上投入重兵,也都跑出了不少产品,市场也普遍抱有期待,希望其中有谁能早上追上 OpenAI,与硅谷 AI 一较高下。

但最终破局的,却是 DeepSeek,大厂没做到的,它反而实现了。

深耕已久

本质上 DeepSeek 当下的爆火,是一种厚积之下的爆发。

虽说此次 DeepSeek 是一鸣惊人,但其团队早就在 AI 领域布局多年,时间线上甚至比大厂还早,布局宽度以及深度,也丝毫不比大厂差多少。

公开数据显示,DeepSeek,由知名私募巨头幻方量化孕育而生,创始人为梁文锋。

事实上,早在大学期间,即便在当时,人工智能还是一个空有理论并无实质的概念,但梁文锋无比笃信,"人工智能一定会改变世界"。

这也成为了其创业以来的终极愿景。

2015 年梁文锋创办幻方,这是是国内最早使用人工智能进行量化交易的公司,2016 年第一份由深度学习生成的交易仓位上线执行,2017 年全面应用深度学习技术进行交易。

到了 2018 年,幻方官网将"把 AI 确定为公司的主要发展方向"写入公司大事,再一年,幻方干脆改变了组织架构,成立了幻方 AI,对外自我介绍时总说自己是一家以大规模深度学习基础研究与应用为核心的人工智能公司。

自 2019 年至 2021 年间,幻方相继自主研发了"萤火一号"与"萤火二号" AI 集群,其中"萤火二号"投资达到 10 亿元,极大提升算力支持。同时,幻方也积极招募了一批算法科学家。而创始人梁文锋本人,则每天也都在写代码、跑代码。

技术上,一直在稳步储备,基建上,更是没有落下。

可能很少有人能预料到,2023 年当 ChatGPT 横空出世时,市场突然发现在国内,拥有高性能 GPU 芯片最多的不是人工智能公司,而是梁文锋旗下的幻方量化。

彼时根据国盛证券研报,在云算力端,当时除了几家互联网公司(商汤、百度、腾讯、字节、阿里),就只有幻方有超过 1 万张 A100 芯片储备。

足见,幻方对 AI 的投入,对比大厂,丝毫不落下风。

反套路

还有就是,以梁文锋为代表的 DeepSeek 创业团队的锐气。

互联网大厂的 AI 战略往往依附于现有业务体系。腾讯的 AI 需服务于社交与游戏生态,阿里的 AI 需嵌入电商和云计算场景。这种业务协同逻辑,固然能快速商业化,却也框定了技术演进的路径——资源投入越多,越倾向于优化既有模式,而非另辟蹊径。

而背靠幻方的 DeepSeek,既有强大的财力支持,又有身为创业者敢于"从零开始",不怕试错的勇气。这让 DeepSeek 只需要沿着创新的信念,一路蹚过去。

对于创新,梁文锋的态度是非常坚决的——"过去很多年,中国公司习惯了别人做技术创新,我们拿过来做应用变现,但这并非是一种理所当然。这一波浪潮里,我们的出发点,就不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展。"

"我们看到的是中国 AI 不可能永远处在跟随的位置。我们经常说中国 AI 和美国有一两年差距,但真实的 gap 是原创和模仿之差。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。"

而如何实现创新,则是抛弃惯性的反套路。

最直接的体现,就是在团队组成上。

国内大厂在进入大模型赛道上,通常倾向于去海外挖人,引入技术大牛,快速拉起一个团队,然后大干快上。而 DeepSeek 团队组多由本土一些 Top 高校的应届毕业生组成,不看经验资历,选人的标准一直都是热爱和好奇心。

同时在工作机制上,"我们一般不前置分工,而是自然分工。每个人有自己独特的成长经历,都是自带想法的,不需要 push 他。探索过程中,他遇到问题,自己就会拉人讨论。不过当一个 idea 显示出潜力,我们也会自上而下地去调配资源。"

"如果有想法,每个人随时可以调用训练集群的卡无需审批。同时因为不存在层级和跨部门,也可以灵活调用所有人,只要对方也有兴趣。"

换句话说,大厂的组织架构,本质是一台精密运转的"效率机器"。但颠覆性创新的诞生,需要的恰恰是反效率的"失控"。

而 DeepSeek 正做到了这一点。

AI 蓝媒汇也就为什么大厂没有做出 DeepSeeK 的问题,向 DeepSeek 提问,后者表示,本质上是组织惯性、商业化压力与技术路径共同作用的结果,并称:

这场由开源模型引发的技术革命,正在倒逼大厂重新思考创新逻辑。若无法跳出既有框架,其技术话语权或将进一步削弱。



上一篇:零售商仅有个位数RTX 5090!微星等已将发售时间推迟
下一篇:Tyla: 黑皮迪士尼公主的完美担当

Powered by 飞艇倍投表计划 @2013-2022 RSS地图 HTML地图