math - 搜索 News

2 小时

强化学习让大模型自动纠错，数学、编程性能暴涨，DeepMind新作

其次用于微调的基础模型初始化在编辑距离上呈现出高度倾斜的分布（图 ...

1 天

全球开源大模型新王！阿里Qwen2.5来了，性能跨量级超Llama3.1

早在2023年8月，阿里云就开源通义千问70亿参数模型至免费可商用，再到今年的Qwen1.5、Qwen2、Qwen2.5接连发布，让开发者快速用上最先进模型的同时，获得更大控制权和调优空间，从而成为更多企业的首选。

1 天

o1带火的CoT到底行不行？新论文引发了论战

OpenAI ο1 的诞生极大地提升了人们对 LLM 推理能力和思维链（CoT）的兴趣。一时之间，似乎思维链很快就会成为所有 LLM 的标配，但思维链并非万能，就连 OpenAI 自己也提到 o1 在某些任务上的表现并不比 GPT-4o ...

2 天

通义千问开源Qwen2.5大模型，性能超越Llama

【TechWeb】9月19日消息，2024云栖大会上，阿里云CTO周靖人发布通义千问新一代开源模型Qwen2.5，旗舰模型Qwen2.5-72B性能超越Llama 405B，再登全球开源大模型王座。

3 天

o1突发内幕曝光？谷歌8月论文已揭示原理，大模型光有软件不存在 ...

o1模型学会完善自己的思维过程，尝试不同的策略，并认识到自己的错误。并且随着更多的强化学习（训练时计算）和更多的思考时间（测试时计算），o1 的性能持续提高。这样的新发现不免让人想到去年谷歌内部文件里提出的观点： ...

2 天

阿里通义千问开源Qwen2.5系列模型：Qwen2-VL-72B媲美GPT-4

Qwen2.5系列模型的开源，不仅采用了Apache2.0许可证，还提供了多种不同规模的版本，以适应不同的应用需求。此外，通义千问团队还开源了性能媲美GPT-4的Qwen2-VL-72B模型。

36氪1 天

Qwen2.5登上全球开源王座，72B模型击败LIama3 405B，轻松胜过GPT-4o-mini

除3B和72B模型外，此次所有开源模型均采用Apache 2.0许可。 Qwen2.5：0.5B、1.5B、3B、7B、14B、32B和72B Qwen2.5-Coder：1.5B、7B和32B（on the way） Qwen2.5-Math：1.5B、7B和72B。直接一整个眼花缭乱，已经有网友开始用上了。相比于Qwen2系列，Qwen2.5系列主要有这么几个方面升级。

1 天

美国智库调研报告：中国的创新体系比人们之前了解的要“强大得多”

据悉，美国信息技术和创新基金会（The Information Technology and Innovation ...

小熊财经 on MSN1 天

阿里云大动作！Qwen2.5开源，百款模型上新，AI界又迎巨变？

【ITBEAR】9月19日消息，在2024年的云栖大会上，阿里云CTO周靖人揭晓了通义千问的新一代开源模型——Qwen2.5。这一全新模型系列覆盖了多种尺寸的大语言模型、多模态模型、数学模型以及代码模型，且每一尺寸模型都提供了基础版、指令跟随版及量化 ...

1 天

阿里发布Qwen2.5全家桶与C++安全新提案，AI工具发展加速引发深思

在人工智能快速发展的今天，技术革新层出不穷。2024年9月19日，阿里巴巴推出了其最新的Qwen2.5语言模型及相关子模型，标志着开源技术领域的一次重大进展。此外，C++社区也宣布了一项颇具革命性的提案——Safe ...

2 天

Qwen2.5称霸开源市场，如何凭72B参数轻松击败LIama3与GPT-4o-mini？

在人工智能技术迅猛发展的今天，开源模型的竞争越来越激烈。近日，阿里巴巴通义AI团队发布的Qwen2.5引起了广泛关注，其72B参数的旗舰模型不仅轻松超越了Facebook的LIama3（405B参数），还在诸多任务上显著领先于GPT-4o-mini。

和讯网1 天

阿里云宣布开源Qwen2.5，上架超100个模型

Qwen2.5-72B模型在MMLU-rudex基准（考察通用知识）、MBPP 基准（考察代码能力）和MATH基准（考察数学能力）的得分高达86.8、88.2、83.1。Qwen2.5支持128K的上下文长度，可生成最多8K内容，支持中文、英文、法文、西班牙文、俄文、日文、越南文、阿拉伯文等 29 种以上语言。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果