@techfrens Coding LLM Benchmarks

Toggle between simple and detailed views. Click on column headers to sort. Click on a row to see full details.

Rank	Model	Pass Rate ↓	Speed per Case	Cost
1	DeepSeek R1 0528 (DeepInfra)	71.6%	330.1s	$8.020
2	DeepSeek-TNG-R1T2-Chimera	64.4%	263.2s	$0.000
3	ERNIE-4.5-300B	61.3%	149.9s	$1.534
4	MS R1	56.9%	374.8s	$0.000
5	qwen3 235B	54%	380.4s	$2.426
6	DeepSeek R1	52%	419.2s	$6.192
7	Flash 2.5 Thinking	48.9%	71.4s	$5.000
8	R1T-Chimera	48.4%	186.4s	$0.000
9	Flash 2.5 Thinking	47.6%	93.1s	$6.000
10	DeepSeek Chat v3	44.9%	65.4s	$1.355
11	Qwen3 30B	39.6%	192.3s	$1.364
12	GPT-4.1-mini	35.7%	40.6s	$2.170
13	Grok-3-mini-beta	30.2%	64.2s	$0.778
14	Qwen 2.5 Coder 32B	11.6%	100.6s	$0.894

@techfren Coding LLM Benchmarks