如果你一直关注人工智能领域,你会知道,在构建最强大、推理能力最强的模型的竞争中,OpenAI、Anthropic 和谷歌等大公司一直占据主导地位。
但是这两天游戏规则刚刚发生了变化。
中国人工智能公司深度求索公司 DeepSeek 发布了一颗重磅炸弹:DeepSeek-R1,这是一个完全开源的推理模型,它不仅可以与 OpenAI 的 O1 相媲美,而且其性能令人惊叹。最棒的是?它是完全开源的,遵循 MIT 许可证。是的,你没看错。
它是完全开源的:DeepSeek-R1 是根据 MIT 许可证发布的,这意味着你可以用它做任何事情——下载、修改、微调,甚至用它来训练新模型。这与 OpenAI 的服务条款形成了鲜明对比,后者禁止使用其输出来训练其他模型。DeepSeek 不仅仅是开源模型;他们还积极鼓励创新。
它与 OpenAI 的 O1 不相上下:根据基准测试,DeepSeek-R1 在数学、编码和推理任务中的表现与 OpenAI 的 O1 相当。在某些情况下,它甚至优于 O1。例如,经过提炼的 70 亿参数模型在 AIME 2024 基准测试中得分为 55.5,击败了 GPT-3.5 和 Claude-3.5 等模型。
它的构建方式与众不同:DeepSeek-R1 使用大规模强化学习 (RL)进行训练,而不依赖于监督式微调 (SFT)。这是一种突破性的方法,因为它允许模型自行探索和学习推理模式,而无需人工输入标记数据。结果如何?一个可以自我验证、反思并生成长链思维来解决复杂问题的模型。
它速度快且易于访问:与某些速度慢或经常宕机的专有模型不同,DeepSeek-R1 速度“快如闪电”,你可在chat.deepseek.com上免费获取。你还可以通过他们的 API 访问它,这不仅比 OpenAI 价格便宜,而且没有速率限制。
上线 18 天日活 1500 万
从上线开始到现在 18 天,DeepSeek 日活达到 1500 万,而 ChatGPT 过 1500 万花了 244 天,增长速度是 ChatGPT 的 13 倍。
至此,DeepSeek 成全球增速最快 AI 应用,截止当前 DeepSeek 在苹果应用商店 157 个国家/地区的第一名。
DeepSeek -R1-Distill-Qwen-7B模型在 AIME 2024 上得分为 55.5,优于 GPT-3.5 和 Claude-3.5。
DeepSeek-R1-Distill-Qwen-32B模型在多个基准测试中击败了 OpenAI 的 O1-mini。
这些精简的模型不仅仅是学术上的好奇心——它们是可以在消费级硬件上运行的实用工具。想象一下,拥有一个与 GPT-4 一样强大的模型,但又足够小,可以在你的笔记本电脑甚至 Raspberry Pi 上运行。这就是 DeepSeek 正在构建的未来。
数学问题:当给出 IIT 入学考试(世界上最难的考试之一)中的一个具有挑战性的积分问题时,DeepSeek-R1 在29 秒内解决了它,并通过逐步推理给出了正确答案。另一方面,GPT-4 无法解决这个问题。
棘手问题:当被问到一道无解的数学题时,DeepSeek-R1 并没有就此放弃——它对问题进行了推理,得出结论认为无解,并解释了原因。这种级别的自我意识在 AI 模型中非常罕见。
化学难题:在一道化学题中,题目包含一个细微错误(二氧化碳写成了一氧化碳),DeepSeek-R1 识别出了错误,并进行了纠正,给出了正确答案。它甚至会自言自语,怀疑用户是不是打错了。
Deepseek已经在多家平台上线
在美国的一些公司已经宣布开始支持 DeepSeek。包括微软, AWS、Groq、Liquid AI、Perplexity、Windsurf 、Cursor、Cerebras、KREA。
特别是英伟达已经上线DeepSeek,称赞其为最先进的大型语言模型。NVIDIA NIM 已经支持 DeepSeek-R1了 (可以理解为NVIDIA部署了DeepSeek-R1卖服务)
还有其它未列入的企业,各种 AI 编程、云服务、AI 搜索纷纷接入接入 Deepseek。
多个国家开始限制DeepSeek
意大利数据保护局(GPDP)星期四(1月30日)对DeepSeek的人工智能聊天机器人展开调查,并表示已禁止其处理意大利用户的数据。
意大利数据保护局表示,在询问该公司个人数据使用情况后,其收到的答复“完全不充分”,因此决定采取行动。
爱尔兰数据保护委员会也要求DeepSeek提交其人工智能大模型如何使用用户数据的报告。另外,澳大利亚国库部长吉姆·查默斯呼吁公民谨慎使用DeepSeek的人工智能模型。
美国官员则声称正在调查DeepSeek对“国家安全”的影响。
作者:跨年的大雄
本文为 @ 场长 创作并授权 21CTO 发布,未经许可,请勿转载。
内容授权事宜请您联系 webmaster@21cto.com或关注 21CTO 公众号。
该文观点仅代表作者本人,21CTO 平台仅提供信息存储空间服务。