01 华人学者Tianhao Wu及其团队提出了一种名为思考偏好优化(Thought Preference Optimization)的方法,使模型能根据任务复杂度进行不同时间的思考。 最近畅销书《Python机器学习》作者 Sebastian ...
西风 发自 凹非寺量子位 | 公众号 QbitAI OpenAI-o1替代品来了,大模型能根据任务复杂度进行不同时间的思考。 不限于推理性的逻辑或数学任务,一般问答也能思考的那种。 最近畅销书《Python机器学习》作者Sebastian Raschka推荐了一项新研究,被网友们齐刷刷码住了。 论文一作为华人学者Tianhao Wu,导师之一是2011年清华特奖得主焦剑涛。 团队提出了一种称作思考 ...