Claude 4: L'Intelligenza Artificiale di Nuova Generazione

Giuseppe Ventrella | May 23, 2025 | Intelligenza artificiale

Claude 4: L'Intelligenza Artificiale di Nuova Generazione

Claude Opus 4 e Sonnet 4: Potenza e Precisione

Anthropic ha annunciato l'arrivo di Claude Opus 4 e Claude Sonnet 4, due modelli di intelligenza artificiale che promettono di ridefinire gli standard nel campo del coding, del ragionamento avanzato e della creazione di agenti AI. Claude Opus 4 si posiziona come il modello di coding più potente al mondo, capace di gestire task complessi e prolungati nel tempo, mantenendo prestazioni elevate anche per diverse ore. Claude Sonnet 4, invece, rappresenta un significativo miglioramento rispetto alla versione precedente (Sonnet 3.7), offrendo capacità di coding e ragionamento superiori e una maggiore precisione nell'interpretazione delle istruzioni.

Entrambi i modelli sono disponibili tramite l'API Anthropic, Amazon Bedrock e Google Cloud's Vertex AI, con prezzi in linea con le versioni precedenti: Opus 4 a $15/$75 per milione di token (input/output) e Sonnet 4 a $3/$15.

Nuove Funzionalità e Integrazioni

Oltre ai miglioramenti nei modelli stessi, Anthropic ha introdotto diverse novità significative. L'utilizzo di strumenti esterni, come la ricerca sul web, durante il processo di ragionamento (Extended Thinking - beta) permette ai modelli di migliorare le risposte alternando ragionamento e accesso a informazioni esterne. Inoltre, è stata migliorata la capacità di utilizzare strumenti in parallelo, seguire istruzioni con maggiore precisione e gestire file locali, consentendo ai modelli di mantenere una migliore continuità e costruire una "memoria" a lungo termine.

Claude Code, precedentemente in anteprima di ricerca, è ora disponibile pubblicamente, integrandosi con GitHub Actions, VS Code e JetBrains, permettendo una programmazione collaborativa più fluida. L'API Anthropic offre nuove funzionalità, tra cui l'esecuzione di codice, il connettore MCP, la Files API e la possibilità di memorizzare nella cache i prompt fino a un'ora.

Benchmark e Risultati

Claude Opus 4 ha ottenuto risultati eccezionali nei benchmark SWE-bench (72.5%) e Terminal-bench (43.2%), dimostrando la sua superiorità nel coding. Diverse aziende hanno testato i modelli, confermando le prestazioni straordinarie, soprattutto in termini di gestione di task complessi e prolungati nel tempo. Claude Sonnet 4, pur non raggiungendo le stesse prestazioni di Opus 4 in tutti i campi, offre un ottimo equilibrio tra capacità e praticità, dimostrando miglioramenti significativi nella comprensione di istruzioni complesse e nella generazione di codice di alta qualità.

Entrambi i modelli mostrano una significativa riduzione (65%) del ricorso a scorciatoie o soluzioni non ottimali rispetto a Sonnet 3.7, migliorando l'affidabilità e la coerenza delle risposte. Claude Opus 4, in particolare, dimostra capacità di memoria straordinarie quando ha accesso a file locali, permettendo di mantenere informazioni cruciali per task a lungo termine.

Fonte: Anthropic.com

Torna al Blog