Groq

AGGREGATEDINFERENCE

N/A

Uptime

N/A

Rating

96.7%

2026-05-222026-06-20

Meta: Llama 3.1 8B Instruct233ms TTFT · 133 TPS

OpenAI: gpt-oss-safeguard-20b221ms TTFT · 620 TPS

OpenAI: gpt-oss-20b331ms TTFT · 411 TPS

Meta: Llama 4 Scout267ms TTFT · 141 TPS

OpenAI: gpt-oss-120b149ms TTFT · 404 TPS

OpenAI: gpt-oss-120b (exacto)183ms TTFT · 439 TPS

Qwen: Qwen3 32B299ms TTFT · 306 TPS

Meta: Llama 3.3 70B Instruct236ms TTFT · 205 TPS

MoonshotAI: Kimi K2 0905206ms TTFT · 207 TPS

MoonshotAI: Kimi K2 0905 (exacto)114ms TTFT · 192 TPS

Inference Models

Model	Input $/M	Output $/M	TTFT	TPS
Meta: Llama 3.1 8B Instruct	$0.05	$0.08	233ms	133
OpenAI: gpt-oss-safeguard-20b	$0.08	$0.30	221ms	620
OpenAI: gpt-oss-20b	$0.08	$0.30	331ms	411
Meta: Llama 4 Scout	$0.11	$0.34	267ms	141
OpenAI: gpt-oss-120b	$0.15	$0.60	149ms	404
OpenAI: gpt-oss-120b (exacto)	$0.15	$0.60	183ms	439
Qwen: Qwen3 32B	$0.29	$0.59	299ms	306
Meta: Llama 3.3 70B Instruct	$0.59	$0.79	236ms	205
MoonshotAI: Kimi K2 0905	$1.00	$3.00	206ms	207
MoonshotAI: Kimi K2 0905 (exacto)	$1.00	$3.00	114ms	192

4.5★★★★★(2 reviews)

clouduser42

★★★★★2025-06-15

Reliable service, great API documentation.

mlresearcher

★★★★☆2025-06-10

Good performance but support could be faster.