70B - 搜索 News

51CTO9 小时

今日最热论文：Scaling Law后继乏力，量化也不管用，AI大佬齐刷刷附议

哈佛、斯坦福、MIT等团队的一项研究表明：训练的token越多，需要的精度就越高。例如，Llama-3在不同数据量下（圆形8B、三角形70B、星星405B），随着数据集大小的增加，计算最优的精度也会增加。

11 小时

Scaling Laws终结，量化无用，AI大佬都在审视这篇论文

然后该研究将注意力转向低精度训练，主要研究量化感知训练（仅权重）和低精度训练。该研究将模型分解为权重、激活和 KV 缓存，找到其中任何一个量化到任意精度时损失的 Scaling ...

腾讯网7 小时

今日最热论文：Scaling Law终结，量化也无用，AI大佬齐附议

几十万人关注，一发表即被行业大佬评为“这是很长时间以来最重要的论文”。哈佛、斯坦福、MIT等团队的一项研究表明：训练的token越多，需要的精度就越高。

虎嗅网8 小时

Scaling Law终结，量化也不管用，AI大佬都在审视这篇论文

本文来自微信公众号：量子位，作者：一水，原文标题：《今日最热论文：Scaling Law后继乏力，量化也不管用，AI大佬齐刷刷附议》，题图来自：AI生成几十万人关注，一发表即被行业大佬评为“这是很长时间以来最重要的论文”。哈佛、斯坦福、MIT等团队的一项研究表明：训练的token越多，需要的精度就越高。例如，Llama-3在不同数据量下（圆形8B、三角形70B、星星405B），随着数据集大小 ...

腾讯网15 小时

解读 Binance AI Agent 报告：大器初显，常若玩物

撰文：深潮 TechFlow在曼谷 Devcon 的火热和街道的烟火霓虹中，AI Meme 们迎来了自己的高光时刻。从 Binance 光速上线 ACT，到 GOAT 再破新高，一切的注意力可能都始于山羊背后的真理终端 --- 当 AI Agent ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果