一线｜月之暗面发布推理模型，即将上线数学模型K0-math

梦里流年今天 2 抢沙发

默认

摘要： 北京时间月日亚冠精英联赛迎来了第二轮的角逐中超球队上海海港远赴客场挑战联赛球队浦项铁人上半场比赛两队创造出了多次破门机会但均未能把握住下半场比赛浦项铁人队的万德森洪胤相韩赞腾讯新闻...

北京时间10月1日，亚冠精英联赛迎来了第二轮的角逐，中超球队上海海港远赴客场挑战K联赛球队浦项铁人。上半场比赛，两队创造出了多次破门机会，但均未能把握住。下半场比赛，浦项铁人队的万德森、洪胤相、韩赞....

腾讯新闻《一线》刘雨点

11月16日，大模型公司月之暗面（Moonshot AI）发布新产品，一款以深度推理为核心功能的数学模型K0-m h。该产品将于近日上线。

月之暗面创始人兼CEO杨植麟在现场介绍称，大模型发生了范式变化，过去是通过next token prediction，但预测下一个词有局限性，是一个静态的数据集，没办法探索更难的任务。接下来大模型的目标是通过reinforcement learning（强化学习）让AI具备思考的能力。“接下来还能持续scale，只是过程不一样。”他称。

杨植麟谈到，什么样的场景最适合让AI锻炼思考能力？他认为是数学场景，这也是前两个月OpenAI发布o1核心想要表达的要点。这样，模型可以自己成为一个体系，不需要和外界交互。同时，强化学习训练出来的模型对于每一步思考更细致，出现跳步比较少，可确保泛化能力。

怎么把强化学习更广泛的使用？把强化学习技术用在搜索场景里面。

他称，上线1年，截至目前，每月超过3600万人在使用Kimi。

据悉，除了深度推理，月之暗面也做探索多模态，深度推理是提高思考能力，思考决定AI的上限；多模态提高交互能力，是必要条件。“思考的重要性远大于交互。”

另外，杨植麟在回复腾讯新闻《一线》的提问中称，去年说长文本是AGI登月的步，那么现在深度推理就是登月的第二步。

他认为，现在看，中美在大模型上的 “是一个常数”。预训练scaling law遇到瓶颈，这对中国大模型团队有可能是一个好事。

对于出海，他称，现在先聚焦，需要耐心一点。

一线｜月之暗面发布推理模型，即将上线数学模型K0-math

标签：模型思考

分享

发表评论取消回复

评论列表（暂无评论，2人围观）参与讨论

还没有评论，来说两句吧...