搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
过去 7 天
时间不限
过去 1 小时
过去 24 小时
过去 30 天
按相关度排序
按时间排序
1 天
Nous Chat 聊天机器人提供类似于 ChatGPT 的界面:并允许用户与模型交互 ...
人工智能研究机构 Nous Research 近期推出了 Nous Chat 聊天机器人,可以访问其大型语言模型 Hermes3-70B。 Nous Chat 聊天机器人提供了类似于 ChatGPT ...
51CTO
8 小时
今日最热论文:Scaling Law后继乏力,量化也不管用,AI大佬齐刷刷附议
哈佛、斯坦福、MIT等团队的一项研究表明:训练的token越多,需要的精度就越高。例如,Llama-3在不同数据量下(圆形8B、三角形70B、星星405B),随着数据集大小的增加,计算最优的精度也会增加。
腾讯网
8 小时
Scaling Laws终结,量化无用,AI大佬都在审视这篇论文
机器之心报道作者:泽南、小舟研究表明,你训练的 token 越多,你需要的精度就越高。最近几天,AI 社区都在讨论同一篇论文。UCSD 助理教授 Dan Fu 说它指明了大模型量化的方向。CMU 教授 Tim Dettmers ...
腾讯网
6 小时
今日最热论文:Scaling Law终结,量化也无用,AI大佬齐附议
几十万人关注,一发表即被行业大佬评为“这是很长时间以来最重要的论文”。 哈佛、斯坦福、MIT等团队的一项研究表明:训练的token越多,需要的精度就越高。
虎嗅网
8 小时
Scaling Law终结,量化也不管用,AI大佬都在审视这篇论文
本文来自微信公众号:量子位,作者:一水,原文标题:《今日最热论文:Scaling Law后继乏力,量化也不管用,AI大佬齐刷刷附议》,题图来自:AI生成 几十万人关注,一发表即被行业大佬评为“这是很长时间以来最重要的论文”。 哈佛、斯坦福、MIT等团队的一项研究表明:训练的token越多,需要的精度就越高。 例如,Llama-3在不同数据量下(圆形8B、三角形70B、星星405B),随着数据集大小 ...
2 天
AI初创公司推出Nous Chat聊天机器人,底层基于Meta Llama 3.1打造
IT之家 11 月 11 日消息,AI 初创公司 Nous Research 近期推出了一款名为 Nous Chat 的 AI 聊天机器人,该机器人基于 Meta Llama 3.1 微调而成的“Hermes 3-70B”模型打造,号称在“模型架构、数据合成、微调和推理”方面均进行深入改进,致力于“以人为本”。
1 天
预测:2025年CIO们将大幅增加AI投资,相关支出达3370亿美元
根据研究公司 IDC 的 最新 预测,到2025年,全球人工智能(AI)相关技术的支出将达到3370亿美元,并预计到2028年这一数字将翻倍,达到7490亿美元。随着各行业 IT 领导者 们不断推动 AI 战略的落实,未来的应用场景将更加丰富多样。
2 天
Nous Chat:新一代聊天机器人将如何变革人机交互?
在现代科技的高速发展下,我们似乎每天都在迎接新的AI产品。然而,最近一款名为Nous Chat的聊天机器人引起了众多关注。基于Meta的Llama 3.1微调而成的Hermes 3-70B模型,它到底能为我们带来怎样的惊喜呢? 引人入胜的开头 你是否曾在长时间的对话中感到困惑,或者期待能有一个能理解你情感的“朋友”?Nous Chat正是为了满足这种人际交互的渴望而生。其背后的AI初创公司Nous ...
3 天
清华厦大等提出“无限长上下文”技术:100 万大海捞针全绿,Llama ...
在大数据领域,MapReduce 是一种分布式并行编程框架,具有横向扩展的数据处理能力。受到 MapReduce 所体现的“分而治之”思想的启发,研究人员设计了一种面向大模型的采用分治策略的长文本处理框架,称为 LLMxMapReduce。
5 天
无问芯穹提出混合稀疏注意力方案MoA,加速长文本生成,实现最高8倍 ...
在大语言模型中,不同的注意力头表现出各异的注意力模式和扩展规则:有的关注全局信息,有的则聚焦局部;有的注意力范围随输入长度增加而扩展,有的则保持不变。然而,现有的统一稀疏注意力机制破坏了这些固有的特性。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈