“书生·浦语”向社会用户开放 同时在大模型界面上发布强推理模型InternThinker 2024-11-26 来源:解放日报
记者 俞陶然
昨天,上海人工智能实验室向社会用户开放了实验室开发的“书生·浦语”大模型,并在这个大模型界面上发布了强推理模型InternThinker(书生思想者)。InternThinker模型具有长思维能力,并能在推理过程中进行反思和纠正,从而在数学、代码、推理谜题等多种复杂推理任务上取得更优结果。
据介绍,上海人工智能实验室一直在开展强推理模型的原创研究,探索出一条高效构建高质量思维链的路径。在训练数据侧,实验室在国内率先开发出大规模合成数据技术;在任务场景侧,InternThinker模型在数学、代码、推理谜题等多种场景中,都能展现出较强的推理能力,并具备一定的任务泛化性。
实验室研发团队采用了更接近人类学习方式的路径,设计了一系列“元动作”来引导模型解决问题的过程,如对问题的理解、知识回忆、规划、执行、反思、总结等。InternThinker在面对复杂任务时,会动态地选择“元动作”,再进一步展开相关动作的具体思维过程。
此外,研究人员还针对专业任务构建了大规模的沙盒环境,为可形式化验证的推理任务提供反馈信号。通过自动化专家模型、人机协同策略生成等方法,他们构建了50种以上不同逻辑思维方式的推理任务思考过程,将执行专业任务的能力融合到InternThinker中。
公众可登录“书生·浦语”大模型网页版(https://internlm-chat.intern-ai.org.cn)体验。
分享: