OpenAI

o3 Mini High

推理模型

Radar Score

32/100

10/12 benchmarks — 部分数据

与其他模型对比 →

能力评分

推理

57/100

3/3

代码

6/100

1/2

数学

0/100

0/1 ⚠️

对话

59/100

2/2

Agent

22/100

2/2

速度

47/100

2/2

基准测试详情

推理

GPQA Diamond

77.3%

MMLU-Pro

80.2%

Humanity's Last Exam

12.3%

代码

SWE-Bench Verified

— 暂无数据

Terminal-Bench Hard

6.1%

数学

AIME 2025

— 暂无数据

对话

Chatbot Arena

1363 ELO

IFEval

67.1%

Agent

τ²-Bench

31.3%

GDPval-AA

13.1%

速度

Output TPS

151.7 tok/s

TTFT

26604.9 ms

价格

输入 / 百万 token$1.10

输出 / 百万 token$4.40

典型查询成本$0.023

1K 输入 + 5K 输出 token（推理）

规格

供应商OpenAI

发布日期2025-02-12

上下文（输入）200K

上下文（输出）100K

开源否

推理模型是