Aggiornato quotidianamente

Benchmark LLM per prodotti reali

Scegli lo stack perfetto per i tuoi progetti di automazione basandoti su dati oggettivi di costo, latenza e qualità.

Esplora i dati Calcola il costo

20+

Modelli

24h

Aggiornamenti

Metriche Chiave

100%

Data-Driven

Scegli il tuo caso d'uso

Ogni scenario richiede un bilanciamento diverso tra intelligenza, velocità e costo. Seleziona per vedere la nostra raccomandazione.

Top 3 per Estrazione Dati Strutturati

Massima precisione e context window, focus su structured output.

Best Choice

Google

Gemini 3.1 Pro Preview

Intelligence

57/100

Output Speed

117t/s

Latency (TTFT)

33.46s

Blended Cost

$4.50/1M

Usa questo stack

OpenAI

GPT-5.4 (xhigh)

Intelligence

57/100

Output Speed

76t/s

Latency (TTFT)

136.78s

Blended Cost

$5.63/1M

Usa questo stack

OpenAI

GPT-5.3 Codex (xhigh)

Intelligence

54/100

Output Speed

65t/s

Latency (TTFT)

77.80s

Blended Cost

$4.81/1M

Usa questo stack

Tabella dati completa

Analizza tutti i modelli monitorati. Dati aggiornati ogni 24h per intelligence, coding e speed.

Mostra solo consigliati (>45)


GPT-5.4 (xhigh)OpenAI	57.2	57.3	76	136.78	$2.50	$15.00
Gemini 3.1 Pro PreviewGoogle	57.2	55.5	117	33.46	$2.00	$12.00
GPT-5.3 Codex (xhigh)OpenAI	54.0	53.1	65	77.80	$1.75	$14.00
Claude Opus 4.6 (Adaptive Reasoning, Max Effort)Anthropic	53.0	48.1	48	9.07	$5.00	$25.00
Claude Sonnet 4.6 (Adaptive Reasoning, Max Effort)Anthropic	51.7	50.9	56	58.88	$3.00	$15.00
GPT-5.2 (xhigh)OpenAI	51.3	48.7	71	83.97	$1.75	$14.00
GLM-5 (Reasoning)Z AI	49.8	44.2	58	0.95	$1.00	$3.20
Claude Opus 4.5 (Reasoning)Anthropic	49.7	47.8	52	10.00	$5.00	$25.00
MiniMax-M2.7MiniMax	49.6	41.9	40	2.09	$0.30	$1.20
MiMo-V2-ProXiaomi	49.2	41.4	0	0.00	$1.00	$3.00

Pagina 1 di 46

Dati forniti da Artificial Analysis. I prezzi sono in $ per 1M token. Aggiornato ogni 24h.

Come li scegliamo

Non ci basiamo solo sui benchmark sintetici. Ottimizziamo per:

1
Qualità su dataset reali
Testiamo "needle in a haystack" su PDF di 50+ pagine.
2
Costo su volumi
Analizziamo il TCO (Total Cost of Ownership) su 100k+ chiamate/mese.
3
Robustezza
Monitoriamo il failure rate e la consistenza dell'JSON output.

Calcolatore Costi LLM

Stima il costo mensile del tuo caso d'uso.

Volume Documenti / Mese

Stima: ~1000 token per documento

Volume Token Totali

Efficiency

$0.14

GPT-5 Nano, Gemini 2.5 Lite

Standard

$0.65

GPT-5 Mini, DeepSeek V3

Frontier

$4.80

GPT-5.2, Gemini 3 Pro, Claude 4.5

*Stime indicative basate sui prezzi di listino attuali.

Vuoi la shortlist per il tuo flusso?

Descrivici il tuo caso d'uso e ti invieremo un'analisi personalizzata con lo stack consigliato.

Benchmark LLM per prodotti reali

Scegli il tuo caso d'uso

Top 3 per Estrazione Dati Strutturati

Gemini 3.1 Pro Preview

GPT-5.4 (xhigh)

GPT-5.3 Codex (xhigh)

Tabella dati completa

Come li scegliamo

Qualità su dataset reali

Costo su volumi

Robustezza

Vuoi la shortlist per il tuo flusso?