DeepSeek团队发表重磅论文_中国经济网—

DeepSeek团队发表重磅论文

2025-09-19 07:39 来源：扬子晚报

查看余下全文

(责任编辑：王惠绵)

DeepSeek团队发表重磅论文

2025年09月19日 07:39 来源：扬子晚报

9月17日，由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文，登上了国际权威期刊《自然（Nature）》的封面。《自然》还配发社论，表示DeepSeek-R1是全球首个经过同行评审的主流大语言模型，对于人工智能（AI）模型开发具有重要意义，呼吁其他公司效仿这一做法。

这篇论文刊登在最新一期《自然》，与今年1月发布的DeepSeek-R1的初版论文相比，披露了更多模型训练的细节。论文作者称，大语言模型（LLM）的推理能力可通过纯强化学习来提升，从而减少增强性能所需的人类输入工作量。训练出的模型在数学、编程竞赛和STEM领域研究生水平问题等任务上，比传统训练的LLM表现更好。

《自然》特意配发社论“为何同行评审对AI模型至关重要”，表示目前几乎所有主流的大模型都还没有经过独立同行评审，这一空白“终于被DeepSeek打破”。

自1月份发布以来，R1已成为该平台解决复杂问题类模型中下载量最高的产品。如今，该模型经过八位专家评审，从原创性、方法学等方面接受了评估。论文与评审报告及作者回应同步发布。

在DeepSeek的案例中，评审专家就对此提出质询。该公司不仅提供了减少数据污染的技术细节，还补充了模型发布后新推出基准的评估结果。同行评审还促使论文作出其他重要修改。《自然》呼吁其他AI公司效仿DeepSeek的做法。

扬子晚报/紫牛新闻记者宋世锋

（责任编辑：王惠绵）