Mythos di Anthropic: L'IA che scova bug rimasti ignoti per 27 anni
Nel panorama della sicurezza informatica, OpenBSD è da sempre considerato un bastione inespugnabile, celebre per il suo rigore e per il numero esiguo di vulnerabilità scoperte nel tempo. Eppure, un bug critico è rimasto annidato nel suo stack TCP per ben 27 anni, sopravvivendo a decenni di revisioni umane, test automatizzati e analisi dei più esperti auditor del mondo. Oggi, quel record di invulnerabilità è stato infranto non da un hacker veterano, ma da un'intelligenza artificiale: Mythos, l'ultima evoluzione dei modelli di Anthropic.
Un salto evolutivo nella cybersecurity autonoma
La scoperta di questa falla non è stata un caso fortuito, ma il risultato di una capacità di analisi che Anthropic definisce come un vero e proprio salto generazionale. A differenza dei modelli precedenti, Mythos ha operato in totale autonomia. Una volta fornito l'input iniziale, il sistema ha navigato tra le complessità del codice sorgente senza alcuna guida umana, identificando una sequenza di due pacchetti in grado di mandare in crash qualsiasi server che utilizzi il sistema operativo colpito.
L'aspetto più dirompente di questa notizia risiede nel rapporto tra costi e benefici. Sebbene l'intera campagna di ricerca di Anthropic sia costata circa 20.000 dollari, la singola esecuzione del modello che ha effettivamente isolato il bug ha avuto un costo inferiore ai 50 dollari. Questo dato trasforma radicalmente l'economia della cybersecurity, rendendo la ricerca di vulnerabilità zero-day accessibile e scalabile a livelli precedentemente inimmaginabili.
Prestazioni senza precedenti: I dati di Mythos
I benchmark tecnici confermano che non ci troviamo di fronte a un miglioramento incrementale, ma a una rivoluzione nel campo dell'ingegneria del software. Nel test di scrittura di exploit su versioni recenti del browser Firefox, Mythos ha registrato ben 181 successi, eclissando i soli 2 successi ottenuti da Claude Opus 4.6. Si tratta di un incremento di efficacia pari a 90 volte rispetto alla generazione precedente.
- SWE-bench Pro: Mythos ha raggiunto il 77,8% di successo nella risoluzione di problemi software complessi, contro il 53,4% dei modelli precedenti.
- CyberGym: Nella riproduzione di vulnerabilità note, il modello ha toccato l'83,1%.
- Cybench CTF: Mythos ha letteralmente saturato il test raggiungendo il 100%, costringendo i team di sicurezza a spostare l'asticella verso la scoperta di vulnerabilità reali nel mondo esterno come unico parametro di valutazione rimasto valido.
La necessità di un nuovo paradigma di difesa
La capacità di Mythos di identificare migliaia di potenziali vulnerabilità in diversi sistemi operativi e applicazioni software impone una revisione immediata delle strategie di difesa globale. Se un'intelligenza artificiale può scovare in pochi minuti ciò che gli esperti umani non hanno visto in tre decenni, i team di sicurezza devono adottare strumenti altrettanto avanzati per la protezione delle infrastrutture critiche.
Il futuro della sicurezza digitale non sarà più una competizione tra esperti umani, ma una sfida tecnologica tra modelli di intelligenza artificiale. In questo scenario, la velocità di rilevamento e la capacità di applicare correzioni automatizzate diventeranno i pilastri fondamentali per sopravvivere in un ecosistema dove le vulnerabilità non hanno più un posto sicuro dove nascondersi.
Español
English
Français
Português
Deutsch
Italiano