Moonshot

Kimi K2

Radar Score

45/100

与其他模型对比 →

能力评分

推理

55/100

3/3

代码

30/100

2/2

数学

57/100

1/1

对话

56/100

2/2

Agent

32/100

2/2

速度

42/100

2/2

基准测试详情

推理

GPQA Diamond

76.6%

MMLU-Pro

82.4%

Humanity's Last Exam

7.0%

代码

SWE-Bench Verified

43.8%

Terminal-Bench Hard

15.9%

数学

AIME 2025

57.0%

对话

Chatbot Arena

1418 ELO

IFEval

41.5%

Agent

τ²-Bench

61.1%

GDPval-AA

2.1%

速度

Output TPS

40.1 tok/s

TTFT

566.4 ms

价格

输入 / 百万 token$0.50

输出 / 百万 token$2.40

典型查询成本$0.0017

1K 输入 + 500 输出 token

规格

供应商Moonshot

发布日期—

上下文（输入）—

上下文（输出）—

开源否

推理模型否