OpenAI

GPT-5 mini

multimodalfunction_callingvisionlong_context

Radar Score

55/100

与其他模型对比 →

能力评分

推理

59/100

3/3

代码

44/100

2/2

数学

85/100

1/1

对话

66/100

2/2

Agent

48/100

2/2

速度

29/100

2/2

基准测试详情

推理

GPQA Diamond

80.3%

MMLU-Pro

82.8%

Humanity's Last Exam

14.6%

代码

SWE-Bench Verified

59.8%

Terminal-Bench Hard

28.8%

数学

AIME 2025

85.0%

对话

Chatbot Arena

1390 ELO

IFEval

71.2%

Agent

τ²-Bench

71.1%

GDPval-AA

25.7%

速度

Output TPS

84.9 tok/s

TTFT

72860.5 ms

价格

输入 / 百万 token~$0.30

输出 / 百万 token~$1.20

典型查询成本$0.00090

1K 输入 + 500 输出 token

~ = 估算价格

规格

供应商OpenAI

发布日期2025-11-01

上下文（输入）128K

上下文（输出）16K

开源否

推理模型否