Cot X - 搜索 News

6 天

大模型连乘法都不会做？一系列新研究再次挑战AI推理能力

在论文中，苹果的研究者发现，只要稍稍更改现有测试集里的数字或词，大语言模型的正确率就会显著下降。如果再加上一些新信息，比如多增加一个条件（把小明花100买苹果，拆成花100买苹果和梨），模型的性能则下降地更为明显。

腾讯网25 天

RAG真能提升LLM推理能力？人大最新研究：数据有噪声，RAG性能不升反降

思维链（Chain of Thought, CoT）通过逐步推理或解释来生成答案，而不是直接提供答案，其形式化表达为 𝑥1=𝑓(𝑥), 𝑥2=𝑓(𝑥,𝑥1),…,𝑦=𝑓(𝑥 ...

腾讯网1 个月

单靠推理Scaling Law无法成就o1！无限推理token，GPT-4o依然完败

【新智元导读】o1的秘诀，和全新的「推理Scaling Law」关系有多大？Epoch AI最近的对比实验表明，算法创新才是关键。 CoT铸就了o1推理王者。它开创了一种推理scaling新范式——随着算力增加、更长响应时间，o1性能也随之增长。这一点，为AI scaling开辟了新的可能性 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果

今日热点