200 万成本打造全球顶流！DeepSeek-R1 登《自然》封面，震撼 AI 界

热点资讯 2025年09月19日 15:50 1 cc

前几年当人们提起人工智能，大多数人还觉得这个高科技产品离人的日常非常遥不可及。

但是短短几年时间，人工智能就迎来了飞速发展，尽管当前还有许多待解决的问题，但人工智能这个“高高在上”的东西，的确正在走进普通人的生活中。

近期一个中国团队的论文登上了《自然》杂志的封面。中国人工智能团队 DeepSeek 公开了其大语言模型 DeepSeek-R1 的研究成果，由梁文锋带队，仅用不到 200 万美元的推理训练成本，这件事立刻引发了整个行业，乃至全世界的关注。

高科技一般都需要巨额资金的投入，在当前AI研发动辄上亿美元的情况下，梁文锋团队的成本控制水平着实令人惊叹。

DeepSeek-R1 并不是突然被创造出来的，而是创始人的在不断摸索中一步步前进。梁文锋在2023年创办 DeepSeek，转向通用人工智能方向。

在成功推出DeepSeek之前，梁文锋已有十余年技术创业经验，曾联合创办雅克比投资和幻方科技。

当时正值国内AI行业正经历从模型堆砌向算法优化的转型，DeepSeek 的切入时间点不是最早的一批，但梁文锋团队另辟蹊径，选择了另一条路。

没有大规模标注数据，要怎么做出高质量模型？

DeepSeek 给出了一个自己的答案，那就是用强化学习替代人类示范。R1 的训练只基于最终答案的对错给予奖励，不模仿人类推理路径，而是通过“组相对策略优化”（GRPO）算法让模型自行摸索思维方式。

论文中提到，该模型在 AIME 2024 数学测试中准确率从 15.6% 提升至 77.9%，在使用自洽解码后达到 86.7%，已超过人类平均水平。

团队还公开否认了“蒸馏OpenAI示例”的传闻。DeepSeek 明确表示，基础模型虽训练于网络数据，但推理训练过程并未参考任何OpenAI生成的示例，核心算法是独立设计。

除了技术上的优势，梁文锋的团队人员构成也令人意想不到。梁文锋在接受采访时提到，核心岗位中大量成员为应届毕业生或工作经验不足两年的年轻人。

DeepSeek这支“非典型”团队在面对成本受限制的问题时，没有选择放弃。而是用内部培养完成了模型从基础到推理的全流程更新。

在资金和算力有限的背景下，DeepSeek 团队寻找到了一条适合自己的路，最终实现技术上的突破。

Nature 的审稿人 Lewis Tunstall 在评论中指出，R1 的方法不仅是创新，更是对现有AI训练范式的更新。

只是自己公司内部用得上自然底气不足，该模型也正在被一些同行所认可。R1 目前的强化学习策略已被多个国际研究机构采纳，开用于优化本地模型推理能力。

DeepSeek-R1 还提供了一种不同的技术路径，跳出了“靠资本堆算力”的竞争思维。这个新模型用不到传统成本的十分之一，完成了一个非常优秀的模型研发过程。

从创立公司到登上Nature，梁文锋和他的团队用了短短几年时间完成了这场技术上的巨大跨越。

很多人把 R1 的出现看作中国AI的一次高光时刻，这不仅是因为技术上的突破，还因为梁文锋团队用事实说明了高质量AI创造，不是必须依赖巨额资金的投入。

不管是人工智能领域，还是其他高科技行业，不是只有资源最雄厚的团队才能走在最前面，真正的胜利是找到更有效的路径。

在算力开发投入越来越昂贵的今天，有了这次梁文锋团队的低成本尝试，或许比模型本身更值得关注。

摊牌了！内塔尼亚胡对华放狠话，把中国当成卡塔尔？中方5字回应