搜索优化
Rewards
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
时间不限
过去 1 小时
过去 24 小时
过去 7 天
过去 30 天
按时间排序
按相关度排序
6 小时
Ilya预言错了,华人Nature一作给RLHF「判死刑」,全球大模型都不可靠
【导读】 Ilya两年前观点,竟被Nature论文反驳了!来自剑桥大学等团队最新研究发现,所有大模型并不可靠,包括最强o1。 2022年,AI大牛Ilya Sutskever曾预测:「随着时间推移,人类预期和AI实际表现差异可能会缩小」。
8 小时
单靠推理Scaling Law无法成就o1!无限推理token,GPT-4o依然完败
新智元报道 编辑:编辑部 HXY【新智元导读】o1的秘诀,和全新的「推理Scaling Law」关系有多大?Epoch ...
凤凰网
3 天
中国杯短道速滑精英联赛石家庄站开赛
当日,2024-2025赛季中国杯短道速滑精英联赛第二站(石家庄)在河北奥体中心开赛。 9月26日,天津市冬季和水上运动管理中心选手刘少昂(前左)在男子甲组1500米首轮比赛中摔倒。他最终被判进半决赛。新华社记者 杨世尧 摄 9月26日,天津市冬季和水上运动管理中心选手刘少昂(前左)在男子甲组1500米首轮比赛中与其他选手发生碰撞。他最终被判进半决赛。新华社记者 杨世尧 摄 9月26日,吉林体育学 ...
腾讯网
5 天
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致性
姚期智教授2004年从普林斯顿辞去终身教职回到清华任教;2005年为清华本科生创立了计算机科学实验班“姚班”;2011年创建“清华量子信息中心”与“交叉信息研究院”;2019年再为清华本科生创立了人工智能学堂班,简称“智班”。
来自MSN
5 天
年轻人的第一款鼠标?小米鼠标X1众筹上新
【本文由小黑盒作者@skyil于09月23日发布,转载请标明出处!】 众筹价:279元 9月25日 正式开启众筹 原相PAW3395传感器(不是3950有线与无线双模连接,且最高8kHz回报率五挡 DPI 调节,最高可达 26000 DPI机身重量仅65g,背部弧线适合多种握持习惯大尺寸特氟龙脚垫,滑动顺畅更耐用 ...
来自MSN
6 天
预训练的 Scaling Law 正在走入死胡同,o1 让更多创业公司重新复活
GPT-4o 读万卷书,「o1」行万里路。 整理 | 宛辰 编辑 | 靖宇 北京时间 9 月 13 日凌晨,OpenAI 在官网发布了其最新一代模型, 没有延续过去 GPT 系列的名称,新模型起名为 o1,当前可以获取 o1-Preview 和 o1 ...
36氪
6 天
o1谎称自己没有CoT?清华UC伯克利:RLHF让模型学会撒谎摸鱼,伪造 ...
最近有用户发现,OpenAI o1在思考过程中明确地表示,自己意识到由于政策原因,不能透露内部的思维链。 同时,它十分明白自己应该避免使用CoT这类特定的短语,而是应该说自己没有能力提供此类信息。 最近流行热梗:永远不要问女生的年龄、男生的薪资 ...
9 天
Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭 ...
随OpenAI爆火的CoT,已经引发了大佬间的激战!谷歌DeepMind首席科学家Denny Zhou拿出一篇ICLR ...
9 天
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT ...
【新智元导读】o1大火背后,最关键的技术是CoT。模型通过一步一步推理,恰恰是「慢思考」的核心要义。而这一观点,其实这家国内大厂早就率先实现了。
Le Figaro
10 天
Vente appartement 4 pièces 94 m² à Vanves (92)
Votre Nouveau QG ! T4 Stylé de 94m² - Livraison en 2025 Caractéristiques qui claquent : Type : Appartement T4 tout confort Surface : 94m² de pur bonheur Étage : 2ème étage ... Pas trop haut, pas trop ...
红板报 on MSN
10 天
OpenAI发布新模型o1,又慢又贵还偏科
Key Points ● o1模型在数学和编程方面的推理能力显著提升,但在其他任务上几乎没有进步; ● 强化学习与思维链是o1推理能力提升的主要动力,代价是模型「思考」时间更长,算力消耗更大; ● ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈