17611538698
webmaster@21cto.com

DeepSeek-R1:一个与 OpenAI O1 相当的小型开源模型

人工智能 0 21 2025-02-01 12:13:01

图片

如果你一直关注人工智能领域,你会知道,在构建最强大、推理能力最强的模型的竞争中,OpenAI、Anthropic 和谷歌等大公司一直占据主导地位。

但是这两天游戏规则刚刚发生了变化。

中国人工智能公司深度求索公司 DeepSeek 发布了一颗重磅炸弹:DeepSeek-R1,这是一个完全开源的推理模型,它不仅可以与 OpenAI 的 O1 相媲美,而且其性能令人惊叹。最棒的是?它是完全开源的,遵循 MIT 许可证。是的,你没看错。

图片

https://github.com/deepseek-ai/DeepSeek-R1


什么是 DeepSeek-R1?


DeepSeek-R1 是一种推理模型,旨在解决数学、编码和逻辑推理等复杂任务。它是 DeepSeek 家族的一部分,该家族最近发布了 DeepSeek-V3,这是目前最好的开源模型之一。但 R1 将事情提升到了一个全新的层级。


它是一种思维模型,这意味着它使用一种称为测试时间推理或计算扩展的过程来逐步推理问题。可以把它想象成一个内部独白,模型会与自己辩论以得出最佳答案。


更令人惊讶的是,DeepSeek-R1 不只是一个模型。该公司还发布了R1 的六个精简版本,参数数量从 15 亿到 700 亿不等。这些较小的模型不仅轻量级,而且功能强大。例如,DeepSeek-R1-Distill-Qwen-1.5B模型在某些基准上的表现优于 GPT-4。


让我们来仔细想想:一个 15 亿参数的模型,小到可以在边缘设备上运行,正在与 OpenAI GPT-4 一较高下。


为什么这是一件大事?


  • 它是完全开源的:DeepSeek-R1 是根据 MIT 许可证发布的,这意味着你可以用它做任何事情——下载、修改、微调,甚至用它来训练新模型。这与 OpenAI 的服务条款形成了鲜明对比,后者禁止使用其输出来训练其他模型。DeepSeek 不仅仅是开源模型;他们还积极鼓励创新。

  • 它与 OpenAI 的 O1 不相上下:根据基准测试,DeepSeek-R1 在数学、编码和推理任务中的表现与 OpenAI 的 O1 相当。在某些情况下,它甚至优于 O1。例如,经过提炼的 70 亿参数模型在 AIME 2024 基准测试中得分为 55.5,击败了 GPT-3.5 和 Claude-3.5 等模型。

  • 它的构建方式与众不同:DeepSeek-R1 使用大规模强化学习 (RL)进行训练,而不依赖于监督式微调 (SFT)。这是一种突破性的方法,因为它允许模型自行探索和学习推理模式,而无需人工输入标记数据。结果如何?一个可以自我验证、反思并生成长链思维来解决复杂问题的模型。

  • 它速度快且易于访问:与某些速度慢或经常宕机的专有模型不同,DeepSeek-R1 速度“快如闪电”,你可在chat.deepseek.com上免费获取。你还可以通过他们的 API 访问它,这不仅比 OpenAI 价格便宜,而且没有速率限制。


上线 18 天日活 1500 万

从上线开始到现在 18 天,DeepSeek 日活达到 1500 万,而 ChatGPT 过 1500 万花了 244 天,增长速度是 ChatGPT 的 13 倍。

至此,DeepSeek 成全球增速最快 AI 应用,截止当前 DeepSeek 在苹果应用商店 157 个国家/地区的第一名。

提炼模型将改变游戏规则


DeepSeek-R1 最令人兴奋的方面之一是精简模型。这些较小的版本使用 R1 生成的数据进行微调,事实证明它们非常强大。例如:


  • DeepSeek -R1-Distill-Qwen-7B模型在 AIME 2024 上得分为 55.5,优于 GPT-3.5 和 Claude-3.5。

  • DeepSeek-R1-Distill-Qwen-32B模型在多个基准测试中击败了 OpenAI 的 O1-mini。


这些精简的模型不仅仅是学术上的好奇心——它们是可以在消费级硬件上运行的实用工具。想象一下,拥有一个与 GPT-4 一样强大的模型,但又足够小,可以在你的笔记本电脑甚至 Raspberry Pi 上运行。这就是 DeepSeek 正在构建的未来。

真实世界的表现:令人惊叹的例子


让我们来谈谈 DeepSeek-R1 到底能做什么。在测试中,它展示了一种不可思议的推理复杂问题的能力,即使问题很棘手或没有解决方案


  • 数学问题:当给出 IIT 入学考试(世界上最难的考试之一)中的一个具有挑战性的积分问题时,DeepSeek-R1 在29 秒内解决了它,并通过逐步推理给出了正确答案。另一方面,GPT-4 无法解决这个问题。

  • 棘手问题:当被问到一道无解的数学题时,DeepSeek-R1 并没有就此放弃——它对问题进行了推理,得出结论认为无解,并解释了原因。这种级别的自我意识在 AI 模型中非常罕见。

  • 化学难题:在一道化学题中,题目包含一个细微错误(二氧化碳写成了一氧化碳),DeepSeek-R1 识别出了错误,并进行了纠正,给出了正确答案。它甚至会自言自语,怀疑用户是不是打错了。


Deepseek已经在多家平台上线

在美国的一些公司已经宣布开始支持 DeepSeek。包括微软, AWS、Groq、Liquid AI、Perplexity、Windsurf 、Cursor、Cerebras、KREA。

特别是英伟达已经上线DeepSeek,称赞其为最先进的大型语言模型。NVIDIA NIM 已经支持 DeepSeek-R1了 (可以理解为NVIDIA部署了DeepSeek-R1卖服务)

还有其它未列入的企业,各种 AI 编程、云服务、AI 搜索纷纷接入接入 Deepseek。

多个国家开始限制DeepSeek

意大利数据保护局(GPDP)星期四(1月30日)对DeepSeek的人工智能聊天机器人展开调查,并表示已禁止其处理意大利用户的数据。

意大利数据保护局表示,在询问该公司个人数据使用情况后,其收到的答复“完全不充分”,因此决定采取行动。

爱尔兰数据保护委员会也要求DeepSeek提交其人工智能大模型如何使用用户数据的报告。另外,澳大利亚国库部长吉姆·查默斯呼吁公民谨慎使用DeepSeek的人工智能模型。

美国官员则声称正在调查DeepSeek对“国家安全”的影响。

人工智能的未来更加开放


DeepSeek-R1 不仅仅是一个模型,它更是一个声明。它证明了你不需要数十亿美元或庞大的公关机器来构建世界级的人工智能。通过正确的方法(在本例中是强化学习),你可以创建与世界上最好的模型相媲美的模型,并让每个人都可以使用它们。


此次发布也为 AI 社区敲响了警钟。虽然 OpenAI 和 Anthropic 等公司一直专注于专有模型,但 DeepSeek 仍保持着开放 AI 的原始精神。他们不只是发布模型;他们还分享训练秘诀,鼓励微调,并授权开发人员在其工作的基础上继续发展。


结语:这是专有模型的终结吗?


不完全是。专有模型仍然有其存在的意义,尤其是对于企业用例而言。但 DeepSeek-R1 有力地提醒我们,开源 AI 不仅活着,而且正在蓬勃发展。有了这样的模型,AI 创新的门槛比以往任何时候都要低。


因此,如果您还没有尝试过,请前往https://chat.deepseek.com并试用 DeepSeek-R1。无论你是开发人员、研究人员还是 AI 爱好者,此模型都值得关注。谁知道呢?得益于 DeepSeek,AI 的下一个重大突破可能就来自各位。


人工智能的未来是开放的,而且看起来比以往任何时候都更加光明!

作者:跨年的大雄

评论