首页 热点资讯文章正文

200 万成本打造全球顶流!DeepSeek-R1 登《自然》封面,震撼 AI 界

热点资讯 2025年09月19日 15:50 1 cc

前几年当人们提起人工智能,大多数人还觉得这个高科技产品离人的日常非常遥不可及。

但是短短几年时间,人工智能就迎来了飞速发展,尽管当前还有许多待解决的问题,但人工智能这个“高高在上”的东西,的确正在走进普通人的生活中。

200 万成本打造全球顶流!DeepSeek-R1 登《自然》封面,震撼 AI 界

近期一个中国团队的论文登上了《自然》杂志的封面。中国人工智能团队 DeepSeek 公开了其大语言模型 DeepSeek-R1 的研究成果,由梁文锋带队,仅用不到 200 万美元的推理训练成本,这件事立刻引发了整个行业,乃至全世界的关注。

高科技一般都需要巨额资金的投入,在当前AI研发动辄上亿美元的情况下,梁文锋团队的成本控制水平着实令人惊叹。

DeepSeek-R1 并不是突然被创造出来的,而是创始人的在不断摸索中一步步前进。梁文锋在2023年创办 DeepSeek,转向通用人工智能方向。

在成功推出DeepSeek之前,梁文锋已有十余年技术创业经验,曾联合创办雅克比投资和幻方科技。

当时正值国内AI行业正经历从模型堆砌向算法优化的转型,DeepSeek 的切入时间点不是最早的一批,但梁文锋团队另辟蹊径,选择了另一条路。

200 万成本打造全球顶流!DeepSeek-R1 登《自然》封面,震撼 AI 界

没有大规模标注数据,要怎么做出高质量模型?

DeepSeek 给出了一个自己的答案,那就是用强化学习替代人类示范。R1 的训练只基于最终答案的对错给予奖励,不模仿人类推理路径,而是通过“组相对策略优化”(GRPO)算法让模型自行摸索思维方式。

论文中提到,该模型在 AIME 2024 数学测试中准确率从 15.6% 提升至 77.9%,在使用自洽解码后达到 86.7%,已超过人类平均水平。

200 万成本打造全球顶流!DeepSeek-R1 登《自然》封面,震撼 AI 界

团队还公开否认了“蒸馏OpenAI示例”的传闻。DeepSeek 明确表示,基础模型虽训练于网络数据,但推理训练过程并未参考任何OpenAI生成的示例,核心算法是独立设计。

除了技术上的优势,梁文锋的团队人员构成也令人意想不到。梁文锋在接受采访时提到,核心岗位中大量成员为应届毕业生或工作经验不足两年的年轻人。

200 万成本打造全球顶流!DeepSeek-R1 登《自然》封面,震撼 AI 界

DeepSeek这支“非典型”团队在面对成本受限制的问题时,没有选择放弃。而是用内部培养完成了模型从基础到推理的全流程更新。

在资金和算力有限的背景下,DeepSeek 团队寻找到了一条适合自己的路,最终实现技术上的突破。

Nature 的审稿人 Lewis Tunstall 在评论中指出,R1 的方法不仅是创新,更是对现有AI训练范式的更新。

只是自己公司内部用得上自然底气不足,该模型也正在被一些同行所认可。R1 目前的强化学习策略已被多个国际研究机构采纳,开用于优化本地模型推理能力。

DeepSeek-R1 还提供了一种不同的技术路径,跳出了“靠资本堆算力”的竞争思维。这个新模型用不到传统成本的十分之一,完成了一个非常优秀的模型研发过程。

200 万成本打造全球顶流!DeepSeek-R1 登《自然》封面,震撼 AI 界

从创立公司到登上Nature,梁文锋和他的团队用了短短几年时间完成了这场技术上的巨大跨越。

很多人把 R1 的出现看作中国AI的一次高光时刻,这不仅是因为技术上的突破,还因为梁文锋团队用事实说明了高质量AI创造,不是必须依赖巨额资金的投入。

不管是人工智能领域,还是其他高科技行业,不是只有资源最雄厚的团队才能走在最前面,真正的胜利是找到更有效的路径。

在算力开发投入越来越昂贵的今天,有了这次梁文锋团队的低成本尝试,或许比模型本身更值得关注。

发表评论

德业号 网站地图 Copyright © 2013-2024 德业号. All Rights Reserved.