当所有人还在惊叹DeepSeek的惊人实力时,OpenAI终于坐不住了。昨夜凌晨,o3-mini紧急上线,在数学代码等基准测试中刷新SOTA,重回王座。最关键的是,免费用户也可以体验!o3-mini实力可不是吹的,在「人类最后一次考试」中,o3-mini(high)直接在准确率和校准误差(Calibration Error)均是最优。o3-mini上线几小时后,OpenAI官方开启了Reddit ...
Source Link当所有人还在惊叹DeepSeek的惊人实力时,OpenAI终于坐不住了。昨夜凌晨,o3-mini紧急上线,在数学代码等基准测试中刷新SOTA,重回王座。最关键的是,免费用户也可以体验!o3-mini实力可不是吹的,在「人类最后一次考试」中,o3-mini(high)直接在准确率和校准误差(Calibration Error)均是最优。o3-mini上线几小时后,OpenAI官方开启了Reddit ...
Source Link
Comments