DeepSeek-R1：一个与 OpenAI O1 相当的小型开源模型

场长

人工智能 45 1676 2025-02-01 12:13:01

如果你一直关注人工智能领域，你会知道，在构建最强大、推理能力最强的模型的竞争中，OpenAI、Anthropic 和谷歌等大公司一直占据主导地位。

但是这两天游戏规则刚刚发生了变化。

中国人工智能公司深度求索公司 DeepSeek 发布了一颗重磅炸弹：DeepSeek-R1，这是一个完全开源的推理模型，它不仅可以与 OpenAI 的 O1 相媲美，而且其性能令人惊叹。最棒的是？它是完全开源的，遵循 MIT 许可证。是的，你没看错。

什么是 DeepSeek-R1？

它是完全开源的：DeepSeek-R1 是根据 MIT 许可证发布的，这意味着你可以用它做任何事情——下载、修改、微调，甚至用它来训练新模型。这与 OpenAI 的服务条款形成了鲜明对比，后者禁止使用其输出来训练其他模型。DeepSeek 不仅仅是开源模型；他们还积极鼓励创新。
它与 OpenAI 的 O1 不相上下：根据基准测试，DeepSeek-R1 在数学、编码和推理任务中的表现与 OpenAI 的 O1 相当。在某些情况下，它甚至优于 O1。例如，经过提炼的 70 亿参数模型在 AIME 2024 基准测试中得分为 55.5，击败了 GPT-3.5 和 Claude-3.5 等模型。
它的构建方式与众不同：DeepSeek-R1 使用大规模强化学习 (RL)进行训练，而不依赖于监督式微调 (SFT)。这是一种突破性的方法，因为它允许模型自行探索和学习推理模式，而无需人工输入标记数据。结果如何？一个可以自我验证、反思并生成长链思维来解决复杂问题的模型。
它速度快且易于访问：与某些速度慢或经常宕机的专有模型不同，DeepSeek-R1 速度“快如闪电”，你可在chat.deepseek.com上免费获取。你还可以通过他们的 API 访问它，这不仅比 OpenAI 价格便宜，而且没有速率限制。

上线 18 天日活 1500 万

从上线开始到现在 18 天，DeepSeek 日活达到 1500 万，而 ChatGPT 过 1500 万花了 244 天，增长速度是 ChatGPT 的 13 倍。

至此，DeepSeek 成全球增速最快 AI 应用，截止当前 DeepSeek 在苹果应用商店 157 个国家/地区的第一名。

这些精简的模型不仅仅是学术上的好奇心——它们是可以在消费级硬件上运行的实用工具。想象一下，拥有一个与 GPT-4 一样强大的模型，但又足够小，可以在你的笔记本电脑甚至 Raspberry Pi 上运行。这就是 DeepSeek 正在构建的未来。

数学问题：当给出 IIT 入学考试（世界上最难的考试之一）中的一个具有挑战性的积分问题时，DeepSeek-R1 在29 秒内解决了它，并通过逐步推理给出了正确答案。另一方面，GPT-4 无法解决这个问题。
棘手问题：当被问到一道无解的数学题时，DeepSeek-R1 并没有就此放弃——它对问题进行了推理，得出结论认为无解，并解释了原因。这种级别的自我意识在 AI 模型中非常罕见。
化学难题：在一道化学题中，题目包含一个细微错误（二氧化碳写成了一氧化碳），DeepSeek-R1 识别出了错误，并进行了纠正，给出了正确答案。它甚至会自言自语，怀疑用户是不是打错了。

Deepseek已经在多家平台上线

在美国的一些公司已经宣布开始支持 DeepSeek。包括微软， AWS、Groq、Liquid AI、Perplexity、Windsurf 、Cursor、Cerebras、KREA。

特别是英伟达已经上线DeepSeek，称赞其为最先进的大型语言模型。NVIDIA NIM 已经支持 DeepSeek-R1了（可以理解为NVIDIA部署了DeepSeek-R1卖服务）

还有其它未列入的企业，各种 AI 编程、云服务、AI 搜索纷纷接入接入 Deepseek。

多个国家开始限制DeepSeek

意大利数据保护局(GPDP)星期四（1月30日）对DeepSeek的人工智能聊天机器人展开调查，并表示已禁止其处理意大利用户的数据。

意大利数据保护局表示，在询问该公司个人数据使用情况后，其收到的答复“完全不充分”，因此决定采取行动。

爱尔兰数据保护委员会也要求DeepSeek提交其人工智能大模型如何使用用户数据的报告。另外，澳大利亚国库部长吉姆·查默斯呼吁公民谨慎使用DeepSeek的人工智能模型。

美国官员则声称正在调查DeepSeek对“国家安全”的影响。