夜袭Open AI DeepSeek开源最强推理模型R1再震欧美同行

站长云网 2025-01-21 GeekPark极客公园站长云网

对标OpenAIo1正式版的国产大模型来了！1月20日晚，DeepSeek（深度求索）公司发布推理模型DeepSeek-R1正式版，同步开源模型权重，并允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。网友热评：这，才是真正的OpenAI。能力相当于一个月200美元的ChatGPTo1版本，却完全免费。

不止如此，DeepSeek一同开源的还有“技术报告”，那些训练R1时踩过的坑、做过的事通通讲给你听，只为铺平AGI的路。

第一时间阅读这份技术报告后，英伟达高级研究科学家JimFan带来了新鲜解读，值得我们大声齐读:

“我们生活在这样一个时代：由非美国公司保持OpenAI最初的使命——做真正开放的前沿研究、为所有人赋能。这似乎讲不通，但戏剧性的往往最有可能发生。

DeepSeek-R1不仅开源了大量模型，还泄露了所有训练秘密。他们可能是第一个显示RL（强化学习）飞轮发挥主要作用、持续增长的OSS项目。

影响可以通过『内部实现了ASI』或『草莓计划』等神话名称来实现。也可以通过简单地转储原始算法和matplotlib学习曲线来产生影响。”

中国公司DeepSeek，正在实现赶超OpenAI的使命。

DeepSeek-R1：

实力派选择“秀肌肉”

“DeepSeek-R1”的发布，摆明了是：有实力所以明晃晃地秀肌肉！

这首先体现在它不整期货那一套，而是“发布即上线”，现在，你就可以在DeepSeek官网与App体验最新的推理模型DeepSeek-R1，随便体验随便用，免费。

登录DeepSeek官网或官方App，打开“深度思考”模式，即可调用最新版DeepSeek-R1完成各类推理任务。｜图片来源：DeepSeek

DeepSeek-R1也同步上线了API，对用户开放思维链输出，通过设置model='deepseek-reasoner'即可调用。

值得注意的是DeepSeek-R1API服务定价为每百万输入tokens1元（缓存命中）/4元（缓存未命中），每百万输出tokens16元。看下面这这图你会有更直接的体感，输出API价格只有OpenAIo1的3%。低价背后，显然仍是秀肌肉，价格实力展现了技术实力——从AIInfra层面降本的技术能力。

图中深蓝色柱子代表DeepSeek-R1，剩下的灰色、浅蓝、青浅灰分别是OpenAIo1不同版本的价格。｜来源：DeepSeek

第三波“秀肌肉”体现在开源开放。DeepSeek-R1开源模型权重几乎是选择了最开放的许可证和用户协议，开源License统一使用MIT，产品协议明确可“模型蒸馏”，主打一个让大家多多来基于它做二次开发、集成。DeepSeek甚至主动给大家示范引导将R1作为教师模型来蒸馏出一个更小但仍有实力的模型，“通过DeepSeek-R1的输出，蒸馏了6个小模型开源给社区，其中32B和70B模型在多项能力上实现了对标OpenAIo1-mini的效果”。

事实上，模型开源选择不同的License背后大有学问，这直接体现不同模型厂商的开放程度，更体现开源背后的目的和策略。比如像Llama、Qwen、GPT-2等模型就不止开放权重，还开放了模型训练的源代码，这可能是为了追求衍生模型的繁荣。而DeepSeek-R1选择只开放权重，但换成了标准化、宽松的MITLicense，更多还是为了让更多开发者能用起来，感受DeepSeek-R1的能力。

我们再来通过几大主流测试基准来感受一下DeepSeek-R1的实力。“性能对齐OpenAI-o1正式版DeepSeek-R1在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩OpenAIo1正式版。”

图片来源：DeepSeek

对于DeepSeek-R1带来的直观感受，硅基流动联合创始人杨攀表示，不止模型能力和性能出色，最近两个模型(R1和V3)在训练技术和模型底层架构上都做了领先全球的创新，而且其论文开放程度也震惊了业界。

在一并公开的模型技术报告中，DeepSeek将“DeepSeek-R1”训练技术全部公开，“旨在促进技术社区的充分交流与创新协作”。

根据技术报告，硅基流动创始人&CEO袁进辉称，DeepSeek-R1是无人区的探索和发现。｜来源：即刻

对于开源模型加技术报告，开源社联合创始人林旅强此前向极客公园表示，开源是最好的“秀技术肌肉”的方式，同时“有的开源模型只开源、不讲他是怎么做的，但是合乎大家期待的开源模型是要搭配技术报告，等于是发paper了。开源模型不够的，因为模型是黑盒子，技术报告会说明一些东西。DeepSeek他们是很透明地把他的技术报告拿来公开，即使一定程度还是会捂着掖着，但是已经是开得比较有态度。今天全球范围的学术派还是会认为，你把一个东西做出来再以开源的方式，是有学术追求的。”

如果DeepSeek的目标是真正达到AGI，就不断需要把踩过的坑、做过的事情开放出来，让大家少走一点弯路，开放才能让整个行业更快达到AGI，他补充道。

最后，我们来随机看一些用户实测评价（截图来源：X.com）：

Twitter用户盛赞R1的实力｜图片来源：X

DeepSeek，还有什么

惊喜是我们不知道的？！

尽管昨晚DeepSeek-R1的发布引发了“这才是OpenAI吧”“东方的OpenAI”等一片称赞。但DeepSeek强得非常扎实、全面。

去年在2024年11月20日发布DeepSeek-R1-Lite预览版时，美国著名半导体与AI咨询机构Semianalysis创始人DylanPatel就坐不住了，第一时间下场“提醒”大家：他们有5万张H100GPU！请不要以为他们只有1万张A100！

因为众所周知的原因，这大概率不是事实，却能反映DeepSeek-R1-Lite的强悍到让行业紧张。

一个月后，DeepSeek上线并同步开源了媲美GPT-4o和Claude3.5Sonnet的模型“DeepSeek-V3”，并附上了详实的技术报告。这一次，几乎惊动了整个硅谷AI圈。卡神（OpenAI创始团队、前TeslaAI总监AndrejKarpathy）、AlexandrWang（Scale.ai创始人）、田渊栋（MetaAI科学家）、贾扬清（LeptonAI创始人）……人均一句“难以置信”。就连SamAltman都忍不住出来酸一把“复刻已经被验证过奏效的东西是容易的”。

DeepSeek-V3发布后，SamAltman疑似喊话DeepSeek。｜截图来源：X.com

随着模型性能逐渐走向全球第一梯队，DeepSeek也迎来了新的发展契机。

过去一年半，DeepSeek专注于模型和研究，但从今年开始，DeepSeek着手做应用了。

2025年1月15日，DeepSeek推出移动端AI助手“DeepSeek”App。目前看，DeepSeekApp跟网页版功能一致，主要有两个功能：联网搜索和深度思考，主打一个简洁，聊天记录也会同步显示在手机端和网页端，尚未针对移动端进行特定功能的打磨，也没有市面上AI助手类App丰富、fancy的功能，更像是一个能让你在手机上体验DeepSeek最新模型的入口。

DeepSeekApp展示图｜来源：AppleStore

对此，一位投资人向极客公园解释DeepSeek开始做应用背后可能的战略转向：“前期DeepSeek靠自己的算力优势积累出了模型技术的领先度。后期要补数据，发App是补数据的手段之一。接入用户数据和场景，可以帮助他更好地进行模型能力的迭代和升级。”

同时，有了DeepSeek-R1和其他模态、类型越来越好的模型，可以期待未来DeepSeek在比如代码模型/应用里有更激进的表现，惊喜才刚刚开始。

责任编辑：站长云网

上篇：马斯克给特斯拉Robotaxi装上方向盘

下篇：科学家呼吁联合国帮助解决太空碎片问题

顶一下[0]

踩一下[0]