搜索优化
Rewards
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
时间不限
过去 1 小时
过去 24 小时
过去 7 天
过去 30 天
按相关度排序
按时间排序
5 小时
Ilya预言错了,华人Nature一作给RLHF「判死刑」,全球大模型都不可靠
【导读】 Ilya两年前观点,竟被Nature论文反驳了!来自剑桥大学等团队最新研究发现,所有大模型并不可靠,包括最强o1。 2022年,AI大牛Ilya Sutskever曾预测:「随着时间推移,人类预期和AI实际表现差异可能会缩小」。
9 天
Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭 ...
随OpenAI爆火的CoT,已经引发了大佬间的激战!谷歌DeepMind首席科学家Denny Zhou拿出一篇ICLR ...
6 小时
单靠推理Scaling Law无法成就o1!无限推理token,GPT-4o依然完败
新智元报道 编辑:编辑部 HXY【新智元导读】o1的秘诀,和全新的「推理Scaling Law」关系有多大?Epoch ...
7 天
o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开
【新智元导读】o1诞生,对于OpenAI团队来说,是最具革命性的时刻。在22分钟完整版采访视频中,他们分享了自己对新模型的思考,以及背后的开发故事。 有时候,当被问及意大利首都是什么问题时,我们几乎不用思考,即刻就能得出答案。但有时候,涉及商业企划书 ...
腾讯网
5 天
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致性
姚期智教授2004年从普林斯顿辞去终身教职回到清华任教;2005年为清华本科生创立了计算机科学实验班“姚班”;2011年创建“清华量子信息中心”与“交叉信息研究院”;2019年再为清华本科生创立了人工智能学堂班,简称“智班”。
36氪
6 天
o1谎称自己没有CoT?清华UC伯克利:RLHF让模型学会撒谎摸鱼,伪造 ...
最近有用户发现,OpenAI o1在思考过程中明确地表示,自己意识到由于政策原因,不能透露内部的思维链。 同时,它十分明白自己应该避免使用CoT这类特定的短语,而是应该说自己没有能力提供此类信息。 最近流行热梗:永远不要问女生的年龄、男生的薪资 ...
12 天
超强o1模型智商已超120!1小时写出NASA博士1年代码,最新编程赛超越99 ...
最终,o1-mini帮助AryanDLuffy获得了3922分的总成绩,在超过16万参赛者中排名277,也就是排名在前0.17%。 对此,Mark Chen和很多网友的想法是,IMO和Codeforces的竞赛题也许可以作为新型的LLM基准测试。然而 ...
13 天
OpenAI 超强 o1 智商超 120 遥遥领先于其他模型:1 小时写出 NASA 博士 1 ...
最终,o1-mini 帮助 AryanDLuffy 获得了 3922 分的总成绩,在超过 16 万参赛者中排名 277,也就是排名在前 0.17%。 这远远超过了 OpenAI 自己做的基准测试结果。o1 模型在他们的模拟 Codeforces 比赛中还只是超过了 89% 的人类选手。
2 天
完全使用「自生成数据」实现LLM自我纠正,DeepMind新突破SCoRe:纠正 ...
Google DeepMind的研究人员发布了一种多轮在线强化学习(RL)方法 SCoRe,在完全使用自生成数据(entirely self-generated data)的情况下,显着提高了LLM的自我纠正能力。 研究人员首先验证了有监督微调 ...
16 天
草莓的真面目终揭开,OpenAI o1 全方位解析!
北京时间凌晨一点左右,OpenAI o1 横空出世,即是之前宣传已久的草莓模型。“突来的消息,那个模是你,这么多天你杳无音讯...”特工们也第一时间被推送到了新模型,这下直接不困了。不就是发了两个模型,十几个演示视频,43 页的论文嘛,起来肝就完了!没睡的特工,出列!拉群开整!o1 ...
12 天
OpenAI o1要跟,怎么跟?这个GitHub项目把解读、博客、相关论文一网打尽
博客概述:这篇博客介绍了 CriticGPT——OpenAI 基于 GPT-4 训练的一个专门给 ChatGPT 挑毛病的新模型。它通过精准地分析 ChatGPT ...
1 天
NeurIPS 2024评审结果公布!AI大佬晒出成绩单,又是被吐槽最严重的一届
论文一:Why Do We Need Weight Decay in Modern Deep Learning?
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈