奇马透露,Exo Labs 的 Mac Mini M4集群能够以每秒18个标记的速度运行 Qwen2.5Coder32B,并以每秒8个标记的速度运行 Nemotron-70B。这表明,用户无需依赖云基础设施就能高效处理 AI 训练和推理任务,使 AI 对隐私和成本敏感的消费者和企业变得更加可及。