得分比第二名翻倍,成本却仅为1/20?!o3中杯在超难推理任务ARC-AGI上的新成绩,属实又给众人带来了亿点点震撼。根据ARC Prize官方介绍,本轮测试得出的关键结论如下: o3 (Medium) 在ARC-AGI-1上得分为57%,成本为1.5美元/任务,优于目前所有已知COT推理模型;o4