Compare Models | LLMRadar

基于 10/12 个共同指标比较

六维能力雷达图

点击轴标签可查看该维度的详细 Benchmark 分数

X 轴: 每百万 token 均价 (log scale) | Y 轴: 综合能力分 | 绿框 = Pareto 前沿

模型	推理	代码	数学	对话	Agent	速度	Radar Score	输入$/1M	输出$/1M
Gemini 3.1 Pro	69	54	96	87	68	41	69	~$2	~$12
Kimi K2 Thinking	64	47	95	71	59	64	67	$0.47	$2
Claude Opus 4.5	68	61	91	74	69	35	66	$5	$25
GPT-5.2	66	58	97	72	60	46	66	$1.75	$14
GLM 5	55	58	80	78	72	44	64	$0.95	$2.55