Cot X - 搜索 News

5 小时

【导读】 Ilya两年前观点，竟被Nature论文反驳了！来自剑桥大学等团队最新研究发现，所有大模型并不可靠，包括最强o1。 2022年，AI大牛Ilya Sutskever曾预测：「随着时间推移，人类预期和AI实际表现差异可能会缩小」。

9 天

随OpenAI爆火的CoT，已经引发了大佬间的激战！谷歌DeepMind首席科学家Denny Zhou拿出一篇ICLR ...

6 小时

新智元报道编辑：编辑部 HXY【新智元导读】o1的秘诀，和全新的「推理Scaling Law」关系有多大？Epoch ...

7 天

【新智元导读】o1诞生，对于OpenAI团队来说，是最具革命性的时刻。在22分钟完整版采访视频中，他们分享了自己对新模型的思考，以及背后的开发故事。有时候，当被问及意大利首都是什么问题时，我们几乎不用思考，即刻就能得出答案。但有时候，涉及商业企划书 ...

姚期智教授2004年从普林斯顿辞去终身教职回到清华任教；2005年为清华本科生创立了计算机科学实验班“姚班”；2011年创建“清华量子信息中心”与“交叉信息研究院”；2019年再为清华本科生创立了人工智能学堂班，简称“智班”。

最近有用户发现，OpenAI o1在思考过程中明确地表示，自己意识到由于政策原因，不能透露内部的思维链。同时，它十分明白自己应该避免使用CoT这类特定的短语，而是应该说自己没有能力提供此类信息。最近流行热梗：永远不要问女生的年龄、男生的薪资 ...

12 天

最终，o1-mini帮助AryanDLuffy获得了3922分的总成绩，在超过16万参赛者中排名277，也就是排名在前0.17%。对此，Mark Chen和很多网友的想法是，IMO和Codeforces的竞赛题也许可以作为新型的LLM基准测试。然而 ...

13 天

最终，o1-mini 帮助 AryanDLuffy 获得了 3922 分的总成绩，在超过 16 万参赛者中排名 277，也就是排名在前 0.17%。这远远超过了 OpenAI 自己做的基准测试结果。o1 模型在他们的模拟 Codeforces 比赛中还只是超过了 89% 的人类选手。

2 天

Google DeepMind的研究人员发布了一种多轮在线强化学习（RL）方法 SCoRe，在完全使用自生成数据（entirely self-generated data）的情况下，显着提高了LLM的自我纠正能力。研究人员首先验证了有监督微调 ...

16 天

北京时间凌晨一点左右，OpenAI o1 横空出世，即是之前宣传已久的草莓模型。“突来的消息，那个模是你，这么多天你杳无音讯...”特工们也第一时间被推送到了新模型，这下直接不困了。不就是发了两个模型，十几个演示视频，43 页的论文嘛，起来肝就完了！没睡的特工，出列！拉群开整！o1 ...

12 天

博客概述：这篇博客介绍了 CriticGPT——OpenAI 基于 GPT-4 训练的一个专门给 ChatGPT 挑毛病的新模型。它通过精准地分析 ChatGPT ...

1 天

论文一：Why Do We Need Weight Decay in Modern Deep Learning?

一些您可能无法访问的结果已被隐去。