LLM rankings, side by side

Benchmarks, cost vs intelligence, context windows, and head-to-head comparisons across every major large language model.

Charts All Models Compare

Model	Cat	Overall▼	Reason	Code	Math	Creat	Instr	Multi	MMLU	GPQA	HumanEval	MATH	SWE-bench	$/1M	Ctx	t/s	Lat	OSS	Mod	Released
GPT-5.5 (xhigh) OpenAI	LLM	54.8	—	75	—	—	—	—	—	—	—	—	—	$11.25	—	80	35533		→	2026-04-23
GPT-5.5 (medium) OpenAI	LLM	50.4	—	72	—	—	—	—	—	—	—	—	—	$11.25	—	71	3560		→	2026-04-23
Claude Sonnet 4.6 (Adaptive Reasoning, Max Effort) Anthropic	LLM	47.2	9	63	—	9	9	8	—	—	—	—	—	$6.00	500K tokens	63	43191		→	2026-02-17
Gemini 3.1 Pro Preview Google DeepMind	LLM	46.5	9	69	—	9	9	10	—	—	—	—	—	$4.50	2M tokens	141	28049		→	2026-02-19
DeepSeek V4 Pro (Reasoning, Max Effort)	LLM	44.3	—	59	—	—	—	—	—	—	—	—	—	$2.17	1M	84	1166		→	2026-04-24
Claude Opus 4.6 (Adaptive Reasoning, Max Effort) Anthropic	LLM	43.7	—	48	—	—	—	—	—	—	—	—	—	$10.00	—	50	13119		→	2026-02-05
GPT-5.5 (low) OpenAI	LLM	43.5	—	61	—	—	—	—	—	—	—	—	—	$11.25	—	69	1644		→	2026-04-23
Muse Spark	LLM	43.1	—	59	—	—	—	—	—	—	—	—	—	$0.00	—	0	0		→	2026-04-08
Claude Opus 4.7 (Non-reasoning, High Effort) Anthropic	LLM	42.7	—	74	—	—	—	—	—	—	—	—	—	$10.00	1M tokens	44	23704		→	2026-04-16
MiMo-V2.5-Pro	LLM	42.2	—	60	—	—	—	—	—	—	—	—	—	$1.35	—	43	2190		→	2026-04-22
Claude Opus 4.5 (Reasoning) Anthropic	LLM	40.8	—	48	91	—	—	—	—	—	—	—	—	$10.00	—	67	14232		→	2025-11-24
DeepSeek V4 Flash (Reasoning, Max Effort)	LLM	40.3	—	56	—	—	—	—	—	—	—	—	—	$0.17	—	114	990		→	2026-04-24
GLM-5.1 (Reasoning)	LLM	40.2	—	56	—	—	—	—	—	—	—	—	—	$2.15	—	85	776		→	2026-04-07
GPT-5.4 mini (xhigh) OpenAI	LLM	40.0	—	56	—	—	—	—	—	—	—	—	—	$1.69	—	177	3913		→	2026-03-17
Qwen3.6 Max Preview	LLM	40.0	—	45	—	—	—	—	—	—	—	—	—	$2.92	—	37	2170		→	2026-04-20
Gemini 3 Pro Preview (high)	LLM	39.6	—	47	96	—	—	—	—	—	—	—	—	$4.50	—	159	27263		→	2025-11-18
Qwen3.6 Plus	LLM	39.6	—	55	—	—	—	—	—	—	—	—	—	$1.13	—	52	1807		→	2026-04-02
GPT-5.4 nano (xhigh) OpenAI	LLM	38.2	—	56	—	—	—	—	—	—	—	—	—	$0.46	—	164	2549		→	2026-03-17
MiniMax-M2.7	LLM	38.1	—	53	—	—	—	—	—	—	—	—	—	$0.53	—	52	1617		→	2026-03-18
GLM-5-Turbo	LLM	38.1	—	37	—	—	—	—	—	—	—	—	—	$0.00	—	0	0		→	2026-03-15
Gemini 3 Flash Preview (Reasoning)	LLM	37.8	—	43	97	—	—	—	—	—	—	—	—	$1.13	—	216	6240		→	2025-12-17
DeepSeek V4 Flash (Reasoning, High Effort)	LLM	37.4	—	40	—	—	—	—	—	—	—	—	—	$0.17	—	0	0		→	2026-04-24
Qwen3.6 27B (Reasoning)	LLM	37.1	—	54	—	—	—	—	—	—	—	—	—	$1.35	—	58	1453		→	2026-04-22
Grok 4.20 0309 (Reasoning) xAI	LLM	36.5	—	42	—	—	—	—	—	—	—	—	—	$3.00	—	240	12532		→	2026-03-10
MiMo-V2-Omni-0327	LLM	36.4	—	37	—	—	—	—	—	—	—	—	—	$0.80	—	85	1840		→	2026-03-27
GPT-5.5 (Non-reasoning) OpenAI	LLM	35.4	—	57	—	—	—	—	—	—	—	—	—	$11.25	—	66	882		→	2026-04-23
KAT Coder Pro V2	LLM	35.4	—	46	—	—	—	—	—	—	—	—	—	$0.53	—	109	1633		→	2026-03-27
GLM-5.1 (Non-reasoning)	LLM	35.4	—	36	—	—	—	—	—	—	—	—	—	$2.15	—	62	873		→	2026-04-07
Claude 4.5 Sonnet (Reasoning) Anthropic	LLM	34.7	—	39	88	—	—	—	—	—	—	—	—	$6.00	—	52	8561		→	2025-09-29
KAT-Coder-Pro V1	LLM	34.6	—	18	95	—	—	—	—	—	—	—	—	$0.53	—	110	1040		→	2025-11-11
Kimi K2.6 (Non-reasoning)	LLM	34.6	—	38	—	—	—	—	—	—	—	—	—	$1.71	—	46	1296		→	2026-04-20
GLM 5V Turbo (Reasoning)	LLM	34.5	—	36	—	—	—	—	—	—	—	—	—	$0.00	—	0	0		→	2026-04-01
Claude Sonnet 4.6 (Non-reasoning, Low Effort) Anthropic	LLM	34.3	—	43	—	—	—	—	—	—	—	—	—	$6.00	—	48	1109		→	2026-02-17
Qwen3.5 397B A17B (Reasoning)	LLM	33.7	—	48	—	—	—	—	—	—	—	—	—	$1.35	—	52	1640		→	2026-02-16
Hy3-preview (Reasoning)	LLM	33.6	—	37	—	—	—	—	—	—	—	—	—	$0.20	—	117	1980		→	2026-04-23
MiMo-V2-Flash (Feb 2026)	LLM	33.2	—	34	—	—	—	—	—	—	—	—	—	$0.15	—	90	1819		→	2025-12-16
Gemini 3 Pro Preview (low)	LLM	33.1	—	39	87	—	—	—	—	—	—	—	—	$4.50	—	0	0		→	2025-11-18
Kimi K2 Thinking	LLM	32.7	—	35	95	—	—	—	—	—	—	—	—	$1.07	—	132	883		→	2025-11-06
o3-pro OpenAI	LLM	32.5	—	—	—	—	—	—	—	—	—	—	—	$35.00	—	34	60391		→	2025-06-10
Qwen3.5 122B A10B (Reasoning)	LLM	32.3	—	46	—	—	—	—	—	—	—	—	—	$1.10	—	147	1097		→	2026-02-24
Qwen3.5 397B A17B (Non-reasoning)	LLM	32.0	—	37	—	—	—	—	—	—	—	—	—	$1.35	—	53	1751		→	2026-02-16
Qwen3 Max Thinking	LLM	31.7	—	31	—	—	—	—	—	—	—	—	—	$2.40	—	43	1519		→	2026-01-26
Qwen3.6 35B A3B (Reasoning)	LLM	31.6	—	42	—	—	—	—	—	—	—	—	—	$0.56	—	146	1453		→	2026-04-16
MiMo-V2-Flash (Reasoning)	LLM	31.2	—	32	96	—	—	—	—	—	—	—	—	$0.15	—	88	1848		→	2025-12-16
DeepSeek V4 Pro (Non-reasoning)	LLM	31.2	—	38	—	—	—	—	—	—	—	—	—	$0.54	—	79	1088		→	2026-04-24
Grok 4.1 Fast (Reasoning) xAI	LLM	30.6	—	31	89	—	—	—	—	—	—	—	—	$0.28	—	99	8891		→	2025-11-19
Qwen3.5 Omni Plus	LLM	30.6	—	28	—	—	—	—	—	—	—	—	—	$1.50	—	55	1356		→	2026-03-30
GPT-5.1 Codex mini (high) OpenAI	LLM	30.6	—	36	92	—	—	—	—	—	—	—	—	$0.69	—	217	2805		→	2025-11-13
o3 OpenAI	LLM	30.4	—	38	88	—	—	—	—	—	—	—	—	$3.50	—	146	6154		→	2025-04-16
GPT-5.4 nano (medium) OpenAI	LLM	30.2	—	35	—	—	—	—	—	—	—	—	—	$0.46	—	156	2708		→	2026-03-17
Mistral Medium 3.5	LLM	29.9	—	47	—	—	—	—	—	—	—	—	—	$3.00	—	113	556		→	2026-04-29
GPT-5.4 mini (medium) OpenAI	LLM	29.8	—	38	—	—	—	—	—	—	—	—	—	$1.69	—	177	5382		→	2026-03-17
Claude 4.5 Haiku (Reasoning) Anthropic	LLM	29.6	—	44	84	—	—	—	—	—	—	—	—	$2.00	—	121	17136		→	2025-10-15
Gemma 4 31B (Reasoning)	LLM	29.4	—	43	—	—	—	—	—	—	—	—	—	$0.20	—	35	885		→	2026-04-02
Qwen3.6 27B (Non-reasoning)	LLM	29.3	—	27	—	—	—	—	—	—	—	—	—	$1.35	—	56	1610		→	2026-04-22
DeepSeek V4 Flash (Non-reasoning)	LLM	28.7	—	35	—	—	—	—	—	—	—	—	—	$0.17	—	103	981		→	2026-04-24
Qwen3.5 122B A10B (Non-reasoning)	LLM	28.1	—	32	—	—	—	—	—	—	—	—	—	$1.10	—	177	1121		→	2026-02-24
MiMo-V2.5-Pro (Non-reasoning)	LLM	27.9	—	37	—	—	—	—	—	—	—	—	—	$1.35	—	47	1947		→	2026-04-22
Gemini 3 Flash Preview (Non-reasoning)	LLM	27.4	—	38	56	—	—	—	—	—	—	—	—	$1.13	—	214	777		→	2025-12-17
DeepSeek V3.1 Terminus (Reasoning)	LLM	26.3	—	34	90	—	—	—	—	—	—	—	—	$1.91	—	0	0		→	2025-09-22
Hy3-preview (Non-reasoning)	LLM	26.1	—	34	—	—	—	—	—	—	—	—	—	$0.20	—	123	2048		→	2026-04-23
Ling-2.6-1T	LLM	26.1	—	33	—	—	—	—	—	—	—	—	—	$0.85	—	0	0		→	2026-04-23
Doubao Seed Code	LLM	26.0	—	31	79	—	—	—	—	—	—	—	—	$0.00	—	0	0		→	2025-11-11
Gemma 4 26B A4B (Reasoning)	LLM	25.7	—	22	—	—	—	—	—	—	—	—	—	$0.20	—	0	0		→	2026-04-02
o4-mini (high) OpenAI	LLM	25.6	—	26	91	—	—	—	—	—	—	—	—	$1.93	—	181	21831		→	2025-04-16
Step 3.5 Flash	LLM	25.5	—	32	—	—	—	—	—	—	—	—	—	$0.15	—	193	1009		→	2026-02-02
NVIDIA Nemotron 3 Super 120B A12B (Reasoning)	LLM	25.4	—	38	—	—	—	—	—	—	—	—	—	$0.41	—	234	1019		→	2026-03-11
DeepSeek V3.2 Exp (Reasoning)	LLM	25.4	—	33	88	—	—	—	—	—	—	—	—	$0.31	—	0	0		→	2025-09-29
Mercury 2	LLM	25.3	—	31	—	—	—	—	—	—	—	—	—	$0.38	—	1054	2879		→	2026-02-20
GLM-4.6 (Reasoning)	LLM	25.1	—	30	86	—	—	—	—	—	—	—	—	$0.96	—	51	1433		→	2025-09-30
Qwen3.5 9B (Reasoning)	LLM	25.0	—	29	—	—	—	—	—	—	—	—	—	$0.11	—	60	372		→	2026-03-02
Gemini 3.1 Flash-Lite	LLM	25.0	—	35	—	—	—	—	—	—	—	—	—	$0.56	—	324	5204		→	2026-03-03
Qwen3 Max Thinking (Preview)	LLM	25.0	—	25	82	—	—	—	—	—	—	—	—	$2.40	—	51	1761		→	2025-11-03
Gemma 4 31B (Non-reasoning)	LLM	24.8	—	34	—	—	—	—	—	—	—	—	—	$0.20	—	58	851		→	2026-04-02
DeepSeek V3.2 (Non-reasoning)	LLM	24.7	—	35	59	—	—	—	—	—	—	—	—	$0.32	—	0	0		→	2025-12-01
MiMo-V2-Flash (Non-reasoning)	LLM	24.7	—	26	68	—	—	—	—	—	—	—	—	$0.15	—	92	1882		→	2025-12-16
K-EXAONE (Reasoning)	LLM	24.7	—	27	90	—	—	—	—	—	—	—	—	$0.00	—	0	0		→	2025-12-31
Trinity Large Thinking	LLM	24.5	—	27	—	—	—	—	—	—	—	—	—	$0.40	—	211	670		→	2026-04-01
Qwen3.6 35B A3B (Non-reasoning)	LLM	24.2	—	18	—	—	—	—	—	—	—	—	—	$0.84	—	140	1300		→	2026-04-16
gpt-oss-120b (high) OpenAI	LLM	23.8	—	30	93	—	—	—	—	—	—	—	—	$0.26	—	302	542		→	2025-08-05
Gemini 2.5 Flash Preview (Sep '25) (Reasoning)	LLM	23.8	—	25	78	—	—	—	—	—	—	—	—	$0.00	—	0	0		→	2025-09-25
Claude 4.5 Haiku (Non-reasoning) Anthropic	LLM	23.7	—	30	39	—	—	—	—	—	—	—	—	$2.00	—	103	623		→	2025-10-15
Kimi K2 0905	LLM	23.5	—	26	57	—	—	—	—	—	—	—	—	$1.07	—	26	1583		→	2025-09-05
o1 OpenAI	LLM	23.4	—	21	—	—	—	—	—	—	—	—	—	$26.25	—	143	16522		→	2024-12-05
EXAONE 4.5 33B	LLM	23.0	—	23	—	—	—	—	—	—	—	—	—	$0.00	—	0	0		→	2026-04-09
GLM-4.7-Flash (Reasoning)	LLM	22.9	—	26	—	—	—	—	—	—	—	—	—	$0.15	—	105	940		→	2026-01-19
Grok 3 mini Reasoning (high) xAI	LLM	22.5	—	25	85	—	—	—	—	—	—	—	—	$0.35	—	57	543		→	2025-02-19
Nova 2.0 Pro Preview (medium)	LLM	21.8	—	34	89	—	—	—	—	—	—	—	—	$3.44	—	127	17108		→	2025-11-27
Nova 2.0 Pro Preview (low)	LLM	19.6	—	26	63	—	—	—	—	—	—	—	—	$3.44	—	133	4077		→	2025-11-27
Nova 2.0 Lite (high)	LLM	18.2	—	23	94	—	—	—	—	—	—	—	—	$0.85	—	178	10979		→	2025-10-29
Claude Code Anthropic	Coding	9.5	10	10	—	9	10	—	—	—	—	—	—	—	1M tokens	—	—		→	—
ElevenLabs Voice (v3) ElevenLabs	Audio	9.4	—	—	—	9	9	—	—	—	—	—	—	—	—	—	—		→	—
Midjourney v7 Midjourney	Image	9.3	—	—	—	10	9	—	—	—	—	—	—	—	—	—	—		→	—
FLUX.1 Pro Black Forest Labs	Image	9.1	—	—	—	9	9	—	—	—	—	—	—	—	—	—	—		→	—
Cursor Composer Anysphere	Coding	9.0	9	9	—	8	9	—	—	—	—	—	—	—	Varies by underlying model	—	—		→	—
Sora OpenAI	Video	8.8	—	—	—	9	9	—	—	—	—	—	—	—	—	—	—		→	—
Llama 3.3 Instruct 70B Meta AI	LLM	8.6	9	11	8	8	9	7	—	—	—	—	—	$0.61	128K tokens	87	658	OSS	→	2024-12-06
GPT 5.5 Codex OpenAI	Coding	—	—	—	—	—	—	—	—	—	—	—	—	—	512k	—	—		→	—
GPT-5.5 Pro (xhigh) OpenAI	LLM	—	—	—	—	—	—	—	—	—	—	—	—	$0.00	—	0	0		→	2026-04-23
GPT-3.5 Turbo (0613) OpenAI	LLM	—	—	—	—	—	—	—	—	—	—	—	—	$0.00	—	0	0		→	2023-06-13
Gemini 3 Deep Think	LLM	—	—	—	—	—	—	—	—	—	—	—	—	$0.00	—	0	0		→	2026-02-05
Cogito v2.1 (Reasoning)	LLM	—	—	25	73	—	—	—	—	—	—	—	—	$1.25	—	95	455		→	2025-11-18
GPT-4o Realtime (Dec '24) OpenAI	LLM	—	—	—	—	—	—	—	—	—	—	—	—	$0.00	—	0	0		→	2024-12-17
EXAONE 4.5 33B (Non-reasoning)	LLM	—	—	—	—	—	—	—	—	—	—	—	—	$0.00	—	0	0		→	2026-04-09
GPT-4o mini Realtime (Dec '24) OpenAI	LLM	—	—	—	—	—	—	—	—	—	—	—	—	$0.00	—	0	0		→	2024-12-17
Mi:dm K 2.5 Pro Preview	LLM	—	—	12	79	—	—	—	—	—	—	—	—	$0.00	—	0	0		→	2025-12-11
Grok 4.3 (Beta) xAI	LLM	—	—	—	—	—	—	—	—	—	—	—	—	—	—	—	—		→	—

Rankings data by Artificial Analysis. CSV imports cover supplementary benchmarks.