首页 > 手游资讯 >推理模型 DeepSeek-R1-Lite 预览版上线,号称媲美 OpenAI o1-preview

推理模型 DeepSeek-R1-Lite 预览版上线,号称媲美 OpenAI o1-preview

2024-11-21 11:54:57欧凯手游网

感谢本站网友 Skyraver 的线索投递!

本站 11 月 20 日消息,DeepSeek 宣布,全新研发的推理模型 DeepSeek-R1-Lite 预览版正式上线。

官方表示,DeepSeek R1 系列模型使用强化学习训练,推理过程包含大量反思和验证,思维链长度可达数万字。该系列模型在数学、代码以及各种复杂逻辑推理任务上,取得了媲美 OpenAI o1-preview 的推理效果,并为用户展现了 o1 没有公开的完整思考过程。

DeepSeek-R1-Lite 预览版模型在美国数学竞赛(AMC)中难度等级最高的 AIME 以及全球顶级编程竞赛(codeforces)等评测中,超越了 GPT-4o 等知名模型。

DeepSeek-R1-Lite 的推理过程长,并且包含了大量的反思和验证。下图展示了模型在数学竞赛上的得分与测试所允许思考的长度紧密相关。

▲红色实线展示了模型所能达到的准确率与所给定的推理长度呈正相关

本站注意到,DeepSeek-R1-Lite 目前仍处于迭代开发阶段,仅支持网页使用,暂不支持 API 调用。DeepSeek-R1-Lite 所使用的也是一个较小的基座模型,无法完全释放长思维链的潜力。

官方称正式版 DeepSeek-R1 模型将完全开源,并公开技术报告和部署 API 服务。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表本站立场。文章及其配图仅供学习分享之

8906
465

同类推荐更多

出差3游戏解析:为什么这款互动游戏让玩家欲罢不能?

出差3游戏解析:为什么这款互动游戏让玩家欲罢不能?

最火的手游资讯

2025-01-29

出差3作为一款具有深度剧情和极富代入感的互动体验游戏,近年来广受玩家喜爱。无论是游戏的故事情节,还是对人物情感的刻画,都展示了开发团队极高的创作水平。它不仅仅是一个简单的游戏,而是带有深刻寓意的生活体验。玩家们通过游戏中的每一个选择,不仅影响着故事的发展,也让每个角色的命运发生着微妙的变化。游戏的类型和玩法方式,使得“出差3”成为了很多人讨论的话题。 出差3:剧情和设定的独特魅力 出差3的剧情设