DeepSeek-R1

Name: DeepSeek-R1
Author: DeepSeek

代码 & 开发工具开源zh/enMIT

模型简介

DeepSeek 推出的 R1 推理模型，通过强化学习实现长链推理，在数学和编程竞赛中表现卓越。

DeepSeek-R1 是首个通过纯强化学习训练出推理能力的开源模型，在 AIME 2024、Codeforces 等竞赛级评测中与 OpenAI o1 相当，引领了开源推理模型的新范式。

DeepSeek 推出的 R1 推理模型，通过强化学习实现长链推理，在数学和编程竞赛中表现卓越。 DeepSeek-R1 是首个通过纯强化学习训练出推理能力的开源模型，在 AIME 2024、Codeforces 等竞赛级评测中与 OpenAI o1 相当，引领了开源推理模型的新范式。

DeepSeek-R1是由DeepSeek开发的代码 & 开发工具领域开源模型，基于DeepSeek架构。

数学推理、代码竞赛、复杂问题求解、逻辑分析

可以通过https://huggingface.co/deepseek-ai/DeepSeek-R1访问官网获取使用方式，开源版本可在 HuggingFace 下载。