LLM CAPABILITY RADAR

IntroducingLLM Radar.

LLM 模型能力对比与价格分析工具。六维雷达图展示推理、代码、数学、对话、Agent、速度能力,散点图分析价格性价比。

llm-radar v1.0
$ llm-radar --top 3
Loading models...
1. Kimi K2 Thinking67/100
2. Gemini 3 Flash66/100
3. GPT-5.166/100

模型总览

显示 20/195 个模型

六大维度

推理

  • GPQA Diamond
  • MMLU-Pro
  • Humanity's Last Exam

代码

  • SWE-Bench Verified
  • Terminal-Bench Hard

数学

  • AIME 2025

对话

  • Chatbot Arena
  • IFEval

Agent

  • τ²-Bench
  • GDPval-AA

速度

  • Output TPS
  • TTFT