OpenAI o1 在数学、代码、长程规划等问题取得显著的进步。一部分业内人士分析其原因是由于构建足够庞大的逻辑数据集 <问题,明确的正确答案> ,再加上类似 AlphaGo 中 MCTS 和 RL ...
2023 年,真格基金天使轮投资月之暗面。创始人杨植麟博士是国内顶尖的 AI 研究者。他曾在 Meta 和 Google Brain 任职,是 Transformer-XL 与 XLNet 等重量级论文的第一作者。 月之暗面是一家 AIGC ...
北京时间 9 月 13 日午夜,OpenAI 发布了推理性能强大的 ο1 系列模型。之后,各路研究者一直在尝试挖掘 ο1 卓越性能背后的技术并尝试复现它。当然,OpenAI 也想了一些方法来抑制窥探,比如有多名用户声称曾试图诱导 ο1 ...
最终,o1-mini 帮助 AryanDLuffy 获得了 3922 分的总成绩,在超过 16 万参赛者中排名 277,也就是排名在前 0.17%。 这远远超过了 OpenAI 自己做的基准测试结果。o1 模型在他们的模拟 Codeforces 比赛中还只是超过了 89% 的人类选手。
有时这些欺骗似乎是无害的。在一个例子中,OpenAI的研究人员要求o1-preview提供一个带有在线参考的布朗尼食谱。该模型的思维链——一个应该模仿人类如何分解复杂想法的功能——在内部承认它无法访问URL,使得请求不可能。o1-preview并没有 ...
估值1500亿美元,意味着OpenAI的估值较今年年初有大幅增加。在年初部分投资者将股份出售给风投公司套现时,对OpenAI的估值是860亿美元,新一轮融资前的估值达到1500亿美元,较年初时就增长了74%。
OpenAI用o1开启推理算力Scaling Law,能走多远? 数学证明来了:没有上限。 斯隆奖得主马腾宇以及Google Brain推理团队创建者Denny Zhou联手证明,只要思维链足够长,Transformer就可以解决任何问题! 通过数学方法,他们证明了Transformer有能力模拟任意多项式大小的数字 ...
博客概述:这篇博客介绍了 CriticGPT——OpenAI 基于 GPT-4 训练的一个专门给 ChatGPT 挑毛病的新模型。它通过精准地分析 ChatGPT ...
当地时间 9 月 12 日,OpenAI 发布了全新模型 o1,这是该公司计划推出的一系列“推理”模型中的第一个,也是之前业内传闻已久的“Strawberry(草莓)”项目。 据介绍,o1 ...
智东西(公众号:zhidxcom)作者 | 香草编辑 | 李水青智东西9月13日报道,今日凌晨,OpenAI突然发布传说中“草莓”模型的部分预览版——OpenAI ...
该公司周四在一篇博文中说,这款名为“o1”的新模型在回应用户询问之前,会花更多时间计算答案。有了这个模型,OpenAI的工具应该能够解决多步骤问题,包括复杂的数学和编码问题。
此前被称为"草莓项目"的OpenAI新项目于北京时间9月13日凌晨推出了。OpenAI在官网介绍,一个新的推理(reasoning)模型系列将开始提供,这个系列模型将用于解决困难问题,这些模型将在作出反应前花更多时间思考,可以通过复杂的过程进行推理, ...