slef - 搜索 News

7 天

事件：OpenAI 新发布的 o1 模型在数学和理科推理能力上取得极大突破，其技术博客隐隐指出 Scaling Law 的范式正在转向推理，且这种 Scaling 形式与预训练有很大不同。这一说辞和「草莓」火热期间所引发的 Scaling 范式转向 ...

3 天

在机器学习尤其是强化学习领域，自我博弈（Self-play）是一种非常重要的学习策略。即使 AI 或者智能体没有明确的对手或者没有外部环境提供额外信息，也能通过自己与自己的博弈来学习并获得提升，这常见于游戏场景。AlphaGo ...

当前正在显示可能无法访问的结果。

今日热点