搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
过去 24 小时
时间不限
过去 1 小时
过去 7 天
过去 30 天
按相关度排序
按时间排序
51CTO
9 小时
今日最热论文:Scaling Law后继乏力,量化也不管用,AI大佬齐刷刷附议
哈佛、斯坦福、MIT等团队的一项研究表明:训练的token越多,需要的精度就越高。例如,Llama-3在不同数据量下(圆形8B、三角形70B、星星405B),随着数据集大小的增加,计算最优的精度也会增加。
11 小时
Scaling Laws终结,量化无用,AI大佬都在审视这篇论文
然后该研究将注意力转向低精度训练,主要研究量化感知训练(仅权重)和低精度训练。该研究将模型分解为权重、激活和 KV 缓存,找到其中任何一个量化到任意精度时损失的 Scaling ...
腾讯网
7 小时
今日最热论文:Scaling Law终结,量化也无用,AI大佬齐附议
几十万人关注,一发表即被行业大佬评为“这是很长时间以来最重要的论文”。 哈佛、斯坦福、MIT等团队的一项研究表明:训练的token越多,需要的精度就越高。
虎嗅网
8 小时
Scaling Law终结,量化也不管用,AI大佬都在审视这篇论文
本文来自微信公众号:量子位,作者:一水,原文标题:《今日最热论文:Scaling Law后继乏力,量化也不管用,AI大佬齐刷刷附议》,题图来自:AI生成 几十万人关注,一发表即被行业大佬评为“这是很长时间以来最重要的论文”。 哈佛、斯坦福、MIT等团队的一项研究表明:训练的token越多,需要的精度就越高。 例如,Llama-3在不同数据量下(圆形8B、三角形70B、星星405B),随着数据集大小 ...
腾讯网
15 小时
解读 Binance AI Agent 报告:大器初显,常若玩物
撰文:深潮 TechFlow在曼谷 Devcon 的火热和街道的烟火霓虹中,AI Meme 们迎来了自己的高光时刻。从 Binance 光速上线 ACT,到 GOAT 再破新高,一切的注意力可能都始于山羊背后的真理终端 --- 当 AI Agent ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈