slef - 搜索 News

2 天

在机器学习尤其是强化学习领域，自我博弈（Self-play）是一种非常重要的学习策略。即使 AI 或者智能体没有明确的对手或者没有外部环境提供额外信息，也能通过自己与自己的博弈来学习并获得提升，这常见于游戏场景。AlphaGo ...

7 天

o1 改变了 Scaling 范式？Self-Play 还值得 All In 吗？

事件：OpenAI 新发布的 o1 模型在数学和理科推理能力上取得极大突破，其技术博客隐隐指出 Scaling Law 的范式正在转向推理，且这种 Scaling 形式与预训练有很大不同。这一说辞和「草莓」火热期间所引发的 Scaling 范式转向 ...

GitHub6 个月

这里是一些框架、中间件等组件的使用文档

Spring不用说,java 开发离不开的框架。这里例举了 Spring 文档根目录gRPC是 Google 开源的一款高性能 RPC 框架，类似的 RPC 框架还有 Apache Dubbo、Apache Thrift 中间件 Nginx是一个高性能的反向代理服务器，同时有丰富的模块来拓展Nginx。这里记录一些不错的学习资源(视频 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果

今日热点