9月17日,由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,登上了国际权威期刊《自然(Nature)》的封面。《自然》还配发社论,表示DeepSeek-R1是全球首个经过同行评审的主流大语言模型,对于人工智能(AI)模型开发具有重要意义,呼吁其他公司效仿这一做法。
这篇论文刊登在最新一期《自然》,与今年1月发布的DeepSeek-R1的初版论文相比,披露了更多模型训练的细节。论文作者称,大语言模型(LLM)的推理能力可通过纯强化学习来提升,从而减少增强性能所需的人类输入工作量。训练出的模型在数学、编程竞赛和STEM领域研究生水平问题等任务上,比传统训练的LLM表现更好。
《自然》特意配发社论“为何同行评审对AI模型至关重要”,表示目前几乎所有主流的大模型都还没有经过独立同行评审,这一空白“终于被DeepSeek打破”。
自1月份发布以来,R1已成为该平台解决复杂问题类模型中下载量最高的产品。如今,该模型经过八位专家评审,从原创性、方法学等方面接受了评估。论文与评审报告及作者回应同步发布。
在DeepSeek的案例中,评审专家就对此提出质询。该公司不仅提供了减少数据污染的技术细节,还补充了模型发布后新推出基准的评估结果。同行评审还促使论文作出其他重要修改。《自然》呼吁其他AI公司效仿DeepSeek的做法。
扬子晚报/紫牛新闻记者 宋世锋