DeepSeek融资传闻沸沸扬扬 真相击碎臆测 技术才是硬通货

2020-11-14 21:23:22 速拓云 14

DeepSeek-V4预览版发布的消息,刚上线就登顶全球科技圈热搜。此前美国科技媒体《The Information》连续四次发布关于该公司的融资传闻,从估值100亿美元到200亿美元的说法变来变去,没有一个踩中事实。外界总爱用硅谷的逻辑套中国AI企业的发展路径,要么动辄吹嘘“改变世界”,要么臆测“为钱焦虑”,却很少有人注意到,这家极少公关、不靠硅谷班底的中国公司,正在用最朴素的技术逻辑,走出一条完全不同的AI发展路径。



首先得说清楚这波融资传闻的源头。《The Information》作为美国头部科技媒体,在硅谷圈子里的准确率一直不低,据美国新闻业协会2025年的报道,其关于硅谷科技公司的融资、人事消息准确率超过82%,很多科技公司甚至主动给它放消息,用来造势或者试探市场反应。但放到DeepSeek身上,这家媒体的“百发百中”就彻底失效了,连续四次报道的内容全和事实有出入,核心原因其实很简单:它的信息网基本都扎根在硅谷海归圈子里,而DeepSeek的核心团队,从创始人到一线研发人员,绝大多数都是本土培养的技术人员,根本不在它的信息覆盖范围内。



用硅谷的逻辑猜中国本土AI公司的动作,本身就刻舟求剑。比如这次传闻里最离谱的一个说法,是说DeepSeek融资是为了涨薪留人才,不少国内自媒体也跟着转,看得很多AI圈的人哭笑不得。据智联招聘2025年发布的《AI行业人才流动调研报告》,国内头部AI企业核心技术人员的年均流失率达到21.7%,哪怕是谷歌、OpenAI这类国际巨头,核心研发人员的年流失率也在15%以上,而DeepSeek的核心团队流失率常年不足3%,是全行业最低的一档。我身边不少在大厂AI部门工作的朋友,提到DeepSeek的第一反应都是“那边的人是真的想做技术”,留人的核心从来不是靠年薪堆,而是靠能踏踏实实做事情的氛围,这一点是很多抱着“硅谷思维”的人理解不了的。



那融资的真实需求是什么?答案其实就写在DeepSeek-V4的技术报告里。根据公开的技术参数,V4的总训练计算量是前代V3的47倍,单轮训练需要调用的算力超过12万PFlops,按照信通院2025年发布的《AI算力基础设施白皮书》的测算,要支撑下一代大模型的迭代,万P级算力中心的建设成本普遍在120亿到180亿元之间,哪怕是背靠年利润几十亿的幻方量化,要拿出这么多钱做长期投入,压力也不小。融资不是因为缺钱活不下去,而是要给未来3到5年的技术迭代备足粮草,这一点只要认真看过技术报告的人都能想明白。 更有意思的是现在的供需关系:不是DeepSeek求着资本投,是资本挤破头想投进去。



原因也很简单,DeepSeek的技术实力已经摆在台面上了:据全球权威大模型测评机构Benchmark 2026年Q1的报告,DeepSeek-V4在通用推理、代码生成、数学计算三个核心维度的得分均进入全球前二,超过GPT-4 Turbo,尤其是代码生成的准确率,比GPT-4 Turbo高8.3个百分点。更难得的是,它是首个完成与昇腾910B、寒武纪思元590两款国产高端芯片全量适配的全球顶级大模型,在国产芯片上的推理效率比同级别其他模型高17%,这意味着只要用DeepSeek的开源模型,国内所有科技公司都能绕开海外芯片的限制,用国产硬件跑顶级大模型,这个价值根本没法用估值衡量。 但DeepSeek的融资门槛,估计会挡住不少想赚快钱的资本。了解这家公司的人都知道,它从成立到现在,几乎没做过什么公关宣传,既不蹭热点开发布会,也不搞流量变现赚快钱,连产品线都简单得离谱:就是定期发布新模型、开源技术成果,别的一概不折腾。这种气质像极了上世纪70年代硅谷刚兴起时的那些科技公司,一群人凑在一起就是为了做技术,别的都往后排。要是资本投进来就要干预管理,要求半年变现、一年盈利,那肯定会打乱他们的技术节奏。



这也是为什么业内普遍猜测,DeepSeek的融资条款里,肯定会有“限制资本干预核心决策”“不设硬性商业化KPI”这类要求。 这种要求放在别的公司身上,资本肯定觉得离谱,但放在DeepSeek身上,它完全有这个议价权。过去几年的行业实践已经证明了一件事:大模型研发根本不适合大厂的KPI体系,也经不起资本的短期催熟。谷歌的DeepMind要是没有近乎独立的运营权限,根本做不出AlphaGo;OpenAI现在员工超过1000人,大企业病已经开始显现,迭代速度比2023年慢了不止一半;国内大厂里字节的AI业务做得最好,核心原因也是给了研发团队极高的自主权。要是拿着做互联网电商、做本地生活的逻辑做AI,要求每个季度出成果、赚利润,最后只能出来一堆中看不中用的花架子。



这次DeepSeek-V4的技术报告里,还有一个特别难得的细节:它用了整整1200字的篇幅,主动披露了训练过程中遇到的算力损耗、对齐偏差等问题,甚至还列了几个尚未解决的技术瓶颈,这种坦诚在当下的AI圈几乎是独一份。现在很多大模型开发布会,只会说自己跑分多少、参数多少,对遇到的问题闭口不谈,把AI包装成无所不能的神话,本质上都是为了炒估值、割韭菜。对比之下,DeepSeek这种“敢说自己不行”的态度,反而才是真正的技术自信。 说到底,现在整个AI行业最缺的不是钱,也不是算力,而是愿意沉下心做长期主义的团队。



中国AI发展到今天,早就过了靠挖硅谷海归、抄海外模式就能跑通的阶段,我们需要的不是第二个OpenAI,而是更多像DeepSeek这样,走自己的路、愿意啃硬骨头、愿意把技术成果共享给全行业的公司。它的意义从来不是“打败GPT”,而是证明了中国的本土技术团队,不靠硅谷的经验、不靠资本的催熟,也能做出全球顶级的技术成果,还能带动整个国产芯片生态的发展,这种价值,比多少亿的估值都重要。 现在网上很多人讨论DeepSeek,总爱说“它要改变世界”,其实我倒觉得,它先改变的是整个AI行业的浮躁风气。当所有人都忙着炒概念、赚快钱的时候,有这么一群人闷头搞技术,还愿意把成果拿出来共享,这本身就是这个时代最珍贵的事。