LLM CAPABILITY RADAR

IntroducingLLM Radar.

LLM 模型能力对比与价格分析工具。六维雷达图展示推理、代码、数学、对话、Agent、速度能力，散点图分析价格性价比。

开始对比浏览模型列表 →

llm-radar v1.0

$ llm-radar --top 3

Loading models...

1. Kimi K2 Thinking67/100

2. Gemini 3 Flash66/100

3. GPT-5.166/100

模型总览

Kimi K2 Thinking

in $0.47 / out $2

Gemini 3 Flash

in $0.5 / out $3

GPT-5.1

in ~$1.25 / out ~$5

Gemini 3 Pro

in ~$2 / out ~$12

gpt-oss-120b

in ~$0.3 / out ~$1.2

o3

GPT-5.2

in $1.75 / out $14

Claude Opus 4.5

in $5 / out $25

GPT-5

in $1.25 / out $5

Claude Sonnet 4.5

in $3 / out $15

Gemini 2.5 Pro Preview 05-06

in ~$1.25 / out ~$10

MiniMax M2

in ~$0.27 / out ~$0.95

GPT-5 mini

in ~$0.3 / out ~$1.2

DeepSeek-V3.2-Exp

in ~$0.55 / out ~$2.19

Kimi K2.5

in ~$0.6 / out ~$2.4

Kimi K2 0905

in ~$0.5 / out ~$2.4

Claude Sonnet 4

in $3 / out $15

GLM 4.5

in ~$0.5 / out ~$2

GLM 4.6

in ~$0.35 / out ~$1.4

Claude Haiku 4.5

显示 20/195 个模型

六大维度

推理

GPQA Diamond
MMLU-Pro
Humanity's Last Exam

代码

SWE-Bench Verified
Terminal-Bench Hard

数学

AIME 2025

对话

Chatbot Arena
IFEval

Agent

τ²-Bench
GDPval-AA

速度

Output TPS
TTFT