“书生·浦语”向社会用户开放同时在大模型界面上发布强推理模型InternThinker

“书生·浦语”向社会用户开放同时在大模型界面上发布强推理模型InternThinker 2024-11-26 来源：解放日报

字号：

大 中 小

记者俞陶然

昨天，上海人工智能实验室向社会用户开放了实验室开发的“书生·浦语”大模型，并在这个大模型界面上发布了强推理模型InternThinker（书生思想者）。InternThinker模型具有长思维能力，并能在推理过程中进行反思和纠正，从而在数学、代码、推理谜题等多种复杂推理任务上取得更优结果。

据介绍，上海人工智能实验室一直在开展强推理模型的原创研究，探索出一条高效构建高质量思维链的路径。在训练数据侧，实验室在国内率先开发出大规模合成数据技术；在任务场景侧，InternThinker模型在数学、代码、推理谜题等多种场景中，都能展现出较强的推理能力，并具备一定的任务泛化性。

实验室研发团队采用了更接近人类学习方式的路径，设计了一系列“元动作”来引导模型解决问题的过程，如对问题的理解、知识回忆、规划、执行、反思、总结等。InternThinker在面对复杂任务时，会动态地选择“元动作”，再进一步展开相关动作的具体思维过程。

此外，研究人员还针对专业任务构建了大规模的沙盒环境，为可形式化验证的推理任务提供反馈信号。通过自动化专家模型、人机协同策略生成等方法，他们构建了50种以上不同逻辑思维方式的推理任务思考过程，将执行专业任务的能力融合到InternThinker中。

公众可登录“书生·浦语”大模型网页版（https://internlm-chat.intern-ai.org.cn）体验。