Anthropic vs. Governo USA: la storia del modello che non si poteva toccare
Anthropic vs. the U.S. Government: The Story of the Model Nobody Was Allowed to Touch
In tre giorni, Anthropic ha lanciato il modello AI piu' potente mai rilasciato al pubblico. Poi il governo americano ha bussato alla porta. Quello che e' successo dopo rivela tutto sulle tensioni irrisolte tra sicurezza nazionale, innovazione e la corsa all'intelligenza artificiale.
In three days, Anthropic launched the most powerful AI model ever released to the public. Then the U.S. government knocked on the door. What happened next reveals everything about the unresolved tensions between national security, innovation, and the race for artificial intelligence.
Il Dipartimento del Commercio USA ha emesso una direttiva di export control che ha obbligato Anthropic a disabilitare Fable 5 e Mythos 5 per l'intera base utenti mondiale. L'accesso agli altri modelli Anthropic non e' stato influenzato.
The U.S. Department of Commerce issued an export control directive forcing Anthropic to disable Fable 5 and Mythos 5 for its entire global user base. Access to all other Anthropic models was not affected.
Cronologia degli eventi
Timeline of Events
Mythos: il modello che non si poteva toccare
Mythos: The Model Too Dangerous to Release
Per capire cosa e' successo il 12 giugno, bisogna tornare indietro di due mesi e capire cosa Anthropic aveva in mano — e perche' aveva scelto di non condividerlo.
To understand what happened on June 12, you need to go back two months and understand what Anthropic had in its hands — and why it chose not to share it.
Mythos 5 non e' un modello AI come gli altri. Secondo Anthropic, durante la fase di test interno ha dimostrato una capacita' fuori scala nel rilevare vulnerabilita' nei software: vulnerabilita' in codebase complesse, componenti software sensibili e infrastrutture critiche. Non una capacita' da demo spettacolare, ma una capacita' operativa: trovare problemi reali piu' velocemente di quanto un team umano possa normalmente fare su larga scala.
Mythos 5 is not an ordinary AI model. According to Anthropic, during internal testing it demonstrated an extraordinary ability to detect software vulnerabilities: vulnerabilities in complex codebases, sensitive software components, and critical infrastructure. Not a flashy demo capability, but an operational one: finding real problems faster than human teams can normally do at scale.
Per la comunita' della cybersecurity, questo ha implicazioni enormi. Un modello in grado di scansionare codebase e trovare zero-day in modo automatizzato, veloce e scalabile, nelle mani sbagliate, sarebbe uno strumento offensivo di livello statale. In quelle giuste, sarebbe il piu' potente sistema di difesa mai costruito.
For the cybersecurity community, this has enormous implications. A model capable of scanning codebases and finding zero-days automatically, quickly, and at scale — in the wrong hands — would be an offensive weapon of state-level capability. In the right hands, it would be the most powerful defensive system ever built.
La risposta di Anthropic e' stata Project Glasswing: prima un accesso controllato a un gruppo iniziale ristretto di organizzazioni verificate, poi un'espansione annunciata a circa 150 nuove organizzazioni in oltre 15 Paesi. Solo uso difensivo. Niente accesso pubblico a Mythos. La societa' ha costruito il programma intorno a una logica di monitoraggio e responsabilita': dare strumenti piu' potenti ai difensori, mantenendo al tempo stesso un controllo stretto sull'uso.
Anthropic’s response was Project Glasswing: controlled access to roughly 50 vetted organizations, including names like Amazon, Apple, Google, Microsoft, and CrowdStrike. Defensive use only. No public access. The company also required 30-day data retention from customers — a costly and unpopular policy — specifically to monitor and quickly shut down any successful exploits.
Un programma di accesso ristretto lanciato da Anthropic per condividere capacita' Mythos con organizzazioni selezionate e verificate per scopi di difesa in cybersecurity. Il programma e' partito con un gruppo iniziale limitato e, secondo Anthropic, e' stato poi esteso a circa 150 nuove organizzazioni in oltre 15 Paesi. L'accesso non e' pubblico e richiede un perimetro d'uso specifico.
A restricted access program launched by Anthropic to share Mythos-level capabilities with vetted organizations for cybersecurity defense purposes. The program began with a limited initial group and, according to Anthropic, was later extended to roughly 150 new organizations in more than 15 countries. Access is not public and requires a specific use perimeter.
Fable 5: Mythos con la cintura di sicurezza
Fable 5: Mythos With a Seatbelt
La domanda che Anthropic si era posta per mesi era: come si porta al mercato un modello cosi' potente senza renderlo un'arma? La risposta era Fable 5, lanciato il 9 giugno 2026.
The question Anthropic had been asking itself for months was: how do you bring such a powerful model to market without making it a weapon? The answer was Fable 5, launched June 9, 2026.
L'idea era semplice ma ambiziosa: prendere le capacita' di Mythos e aggiungere un sistema di guardrail indipendente — classificatori separati dal modello stesso — che bloccassero le risposte nelle aree considerate ad alto rischio: cybersecurity avanzata, biologia, armi, ecc. Non semplicemente affinare il modello a rifiutare certi prompt, ma costruire un layer di filtraggio esterno che operasse in parallelo.
The idea was simple but ambitious: take Mythos’s capabilities and add an independent guardrail system — classifiers separate from the model itself — that blocked responses in high-risk areas: advanced cybersecurity, biology, weapons, etc. Not simply tuning the model to refuse certain prompts, but building an external filtering layer that operated in parallel.
Il risultato, secondo la narrativa tecnica di Anthropic, era il primo tentativo di portare capacita' di classe Mythos verso il pubblico generale, ma con barriere di sicurezza molto piu' rigide rispetto al modello riservato. Non era Mythos libero. Era Fable: stesso livello di ambizione, cintura di sicurezza inserita, e accesso commerciale potenzialmente enorme.
The result, according to Anthropic's technical narrative, was the first attempt to move Mythos-class capability toward the general public while keeping much tighter safeguards than the restricted model. It was not unrestricted Mythos. It was Fable: the same level of ambition, with the seatbelt on, and with potentially massive commercial reach.
Anthropic aveva anche comunicato con trasparenza i limiti del sistema: i guardrail non sono infallibili. Jailbreak “narrow” — cioe' parziali, non universali — erano prevedibili. Il piano era monitorarli, chiuderli, evolvere le protezioni. La stessa ammissione pubblica che nessun sistema e' impenetrabile avrebbe poi giocato contro di loro.
Anthropic had also transparently communicated the system’s limitations: the guardrails are not foolproof. “Narrow” jailbreaks — partial, non-universal ones — were predictable. The plan was to monitor them, close them, evolve the protections. That same public admission that no system is impenetrable would later be used against them.
La direttiva: export control come arma di regolamentazione
The Directive: Export Control as a Regulatory Weapon
Alle 17:21 ET del 12 giugno, Anthropic ha ricevuto una lettera. Il mittente era il governo degli Stati Uniti, e il contenuto era inequivocabile: sospendere immediatamente l'accesso a Fable 5 e Mythos 5 per qualsiasi “foreign national”, ovunque nel mondo, inclusi i dipendenti di Anthropic con nazionalita' straniera.
At 5:21pm ET on June 12, Anthropic received a letter. The sender was the United States government, and the content was unambiguous: immediately suspend access to Fable 5 and Mythos 5 for any “foreign national,” anywhere in the world, including Anthropic’s own foreign national employees.
Il problema e' che non esiste un modo tecnico di applicare quella restrizione in modo selettivo. Anthropic non puo' verificare in tempo reale la nazionalita' di ogni utente. L'unica soluzione per essere in compliance era spegnere tutto. E cos''e' quello che ha fatto.
The problem is there is no technical way to apply that restriction selectively. Anthropic cannot verify in real time the nationality of every user. The only solution to be in compliance was to shut everything down. And that is what it did.
Secondo Axios, la decisione e' maturata dentro l'amministrazione dopo segnalazioni di rischio legate alla possibilita' di aggirare le protezioni del modello. La preoccupazione di fondo e' chiara: Mythos-class significa capacita' cyber molto avanzate, e una capacita' difensiva straordinaria puo' diventare rapidamente un rischio offensivo se finisce fuori controllo.
According to Axios, the decision formed inside the administration after risk warnings tied to the possibility of bypassing the model's safeguards. The underlying concern is clear: Mythos-class means very advanced cyber capability, and an extraordinary defensive capability can quickly become an offensive risk if it slips out of control.
“Abbiamo ricevuto la direttiva dal governo oggi alle 17:21 (ET). La lettera non forniva dettagli specifici sulla preoccupazione di sicurezza nazionale. La nostra comprensione e' che il governo ritiene di essere a conoscenza di un metodo per aggirare Fable 5.”
“We received the directive from the government today at 5:21pm (ET). The letter did not provide specific details of its national security concern. Our understanding is that the government believes it has become aware of a method of bypassing, or ‘jailbreaking’ Fable 5.”
— Anthropic, Statement ufficiale, 12 giugno 2026Quello che Anthropic ha poi sostenuto pubblicamente e' che la dimostrazione ricevuta riguardava l'identificazione di un piccolo numero di vulnerabilita' gia' note e minori. Secondo la societa', altri modelli pubblicamente disponibili erano gia' in grado di trovare risultati simili senza richiedere lo stesso bypass.
What Anthropic later argued publicly is that the demonstration it reviewed involved identifying a small number of previously known, minor vulnerabilities. According to the company, other publicly available models were already able to find similar results without requiring the same bypass.
La lettera del governo non includeva prove scritte. Solo la comunicazione verbale dell'esistenza di un jailbreak. Anthropic ha poi ricevuto un report che ritiene essere la base della direttiva, lo ha analizzato, e ha concluso che le capacita' dimostrate sono “widely available from other models” e “used every day by the defenders who keep systems safe.”
The government’s letter included no written evidence. Only verbal communication of the existence of a jailbreak. Anthropic later received a report it believes was the basis of the directive, analyzed it, and concluded that the demonstrated capabilities are “widely available from other models” and “used every day by the defenders who keep systems safe.”
La risposta di Anthropic: compliance con protesta
Anthropic’s Response: Compliance With Protest
Anthropic ha scelto di non combattere la direttiva in modo immediato. Si e' messa in compliance. Ha spento i modelli. Ma ha anche deciso di non farlo in silenzio.
Anthropic chose not to fight the directive immediately. It complied. It shut down the models. But it also decided not to do so in silence.
Lo statement pubblicato sulla homepage di Anthropic e' un documento insolito per una grande azienda tecnologica che si trova sotto pressione regolatoria: lungo, tecnico, dettagliato e — per gli standard del corporate speak — sorprendentemente franco. Anthropic spiega punto per punto la propria posizione tecnica, smonta il jailbreak descritto dal governo, e poi va direttamente al nocciolo del problema politico.
The statement published on Anthropic’s homepage is an unusual document for a major tech company under regulatory pressure: long, technical, detailed and — by corporate speak standards — surprisingly candid. Anthropic explains its technical position point by point, dismantles the jailbreak described by the government, and then goes directly to the core of the political problem.
“Non siamo d'accordo che il rilevamento di un jailbreak parziale possa essere motivo per ritirare un modello commerciale distribuito a centinaia di milioni di persone. Se questo standard venisse applicato a tutta l'industria, riteniamo che fermerebbe sostanzialmente tutti i nuovi deployment di modelli per tutti i provider di frontiera.”
“We disagree that the finding of a narrow potential jailbreak should be cause for recalling a commercial model deployed to hundreds of millions of people. If this standard was applied across the industry, we believe it would essentially halt all new model deployments for all frontier model providers.”
— Anthropic, Statement ufficialeL'argomento tecnico centrale di Anthropic e' questo: i guardrail piu' forti di Fable 5 non sono nel modello stesso. Sono nei classificatori indipendenti che operano come layer separato. Questo significa che anche se qualcuno convince il modello a “continuare a parlare” oltre un rifiuto iniziale, i sistemi di protezione contro gli output piu' pericolosi rimangono in piedi. Il jailbreak dimostrato al governo, sostiene Anthropic, non bypassa quel layer esterno.
Anthropic’s core technical argument is this: Fable 5’s strongest safeguards are not in the model itself. They are in the independent classifiers that operate as a separate layer. This means that even if someone convinces the model to “keep talking” past an initial refusal, the protection systems against the most dangerous outputs remain in place. The jailbreak demonstrated to the government, Anthropic argues, does not bypass that external layer.
Anthropic afferma anche di non aver ancora ricevuto un esempio di jailbreak che abbia prodotto un risultato realmente dannoso. La singola dimostrazione ricevuta consisteva in risposte che la societa' definisce “either entirely benign or minor findings that provide no Mythos-specific uplift” — cioe' niente che non si possa gia' fare con modelli concorrenti liberi sul mercato.
Anthropic also states it has yet to receive an example of a jailbreak that produced a genuinely harmful result. The single demonstration received consisted of responses the company describes as “either entirely benign or minor findings that provide no Mythos-specific uplift” — meaning nothing that couldn’t already be done with competitor models freely on the market.
Se il governo USA decidesse che qualsiasi “narrow jailbreak” e' sufficiente per ritirare un modello dal mercato, nessun provider di AI potrebbe mai rilasciare un modello di frontiera. Ogni modello sufficientemente capace e' vulnerabile a jailbreak parziali. E' una legge tecnica, non una mancanza di diligenza. La posizione di Anthropic e' che il governo dovrebbe stabilire standard trasparenti, tecnici e basati su danni reali — non su vulnerabilita' teoriche condivise verbalmente.
If the U.S. government decided that any “narrow jailbreak” is sufficient to pull a model from the market, no AI provider could ever release a frontier model. Every sufficiently capable model is vulnerable to partial jailbreaks. It’s a technical law, not a lack of diligence. Anthropic’s position is that the government should establish transparent, technical standards based on real harms — not theoretical vulnerabilities shared verbally.
L'ironia perfetta: le safety warnings che hanno spento i modelli
The Perfect Irony: The Safety Warnings That Shut Down the Models
Esiste un filo rosso che collega questa storia dall'inizio alla fine, e TechCrunch lo ha catturato meglio di tutti nel suo titolo: “Anthropic's safety warnings may have just backfired.”
There is a red thread that connects this story from beginning to end, and TechCrunch captured it best in its headline: “Anthropic’s safety warnings may have just backfired.”
Anthropic ha costruito la propria identita' pubblica sull'essere l'alternativa responsabile nel mondo dell'AI. Non il laboratorio che corre piu' veloce, ma quello che corre con piu' cura. Per mesi, ha comunicato al mondo che Mythos era cos'i' potente e cos'i' pericoloso da richiedere un accesso ristretto, verificato e monitorato. Ogni comunicazione pubblica sottolineava le capacita' del modello in termini di vulnerabilita' software. Ogni volta che spiegava perche' non poteva rilasciarlo liberamente, stava anche descrivendo in dettaglio cosa sarebbe stato capace di fare nelle mani sbagliate.
Anthropic built its public identity on being the responsible alternative in the AI world. Not the lab that runs fastest, but the one that runs most carefully. For months, it communicated to the world that Mythos was so powerful and so dangerous as to require restricted, verified, monitored access. Every public communication emphasized the model’s capabilities in terms of software vulnerabilities. Every time it explained why it couldn’t release it freely, it was also describing in detail what it would be capable of in the wrong hands.
Il governo americano ha ascoltato. E ha agito di conseguenza.
The U.S. government listened. And acted accordingly.
Sam Altman di OpenAI aveva anticipato — ironicamente — questa dinamica in aprile, in una conversazione con il podcaster Ashlee Vance. Aveva definito la gestione di Mythos come “fear-based marketing” e aveva usato una metafora che, alla luce degli eventi, appare quasi profetica.
OpenAI’s Sam Altman had ironically anticipated this dynamic in April, in a conversation with podcaster Ashlee Vance. He had described Mythos’s handling as “fear-based marketing” and used a metaphor that, in light of events, appears almost prophetic.
“E' chiaramente un marketing brillante dire: 'Abbiamo costruito una bomba. Stavamo per lanciarla sulla tua testa. Ti venderemo un rifugio antiatomico per 100 milioni di dollari.'”
“It is clearly incredible marketing to say, ‘We have built a bomb. We were about to drop it on your head. We will sell you a bomb shelter for $100 million.'”
— Sam Altman, CEO OpenAI, aprile 2026Altman non stava prevedendo uno shutdown governativo. Stava identificando una tensione comunicativa. Ma il risultato e' stato che quando il governo ha cercato chi aveva il modello AI piu' pericoloso del mondo, la risposta era scritta nelle stesse press release di Anthropic. La societa' aveva passato mesi a convincere il pubblico — e apparentemente il governo — che Mythos era in una categoria a se stante. Il governo l'ha creduto.
Altman was not predicting a government shutdown. He was identifying a communications tension. But the result was that when the government looked for who had the world’s most dangerous AI model, the answer was written in Anthropic’s own press releases. The company had spent months convincing the public — and apparently the government — that Mythos was in a category of its own. The government believed it.
IPO, OpenAI e le implicazioni competitive
IPO, OpenAI, and the Competitive Implications
Questa storia non si svolge in un vuoto. L'1 giugno 2026 Anthropic ha comunicato di aver presentato in via confidenziale alla SEC una bozza di registration statement su Form S-1 per una possibile IPO. Il numero di azioni, il prezzo e la tempistica non sono ancora stati fissati. Proprio per questo, l'episodio del 12 giugno arriva in un momento delicatissimo: la societa' deve mostrare al mercato di poter costruire modelli potentissimi, ma anche di poterli governare.
This story does not unfold in a vacuum. On June 1, 2026, Anthropic said it had confidentially submitted a draft registration statement on Form S-1 to the SEC for a possible IPO. The number of shares, pricing, and timing have not yet been set. That makes the June 12 episode especially delicate: the company has to show the market it can build extremely powerful models, while also proving it can govern them.
L'evento del 12 giugno crea una complicazione diretta per quella narrativa. Se il governo americano puo' ordinare la disabilitazione dei prodotti piu' avanzati di Anthropic con una direttiva arrivata in tempi strettissimi e senza dettagli pubblici completi sulla preoccupazione di sicurezza nazionale, allora il rischio regolatorio sui modelli di frontiera diventa molto piu' concreto.
The June 12 event creates a direct complication for that narrative. If the U.S. government can order the disabling of Anthropic’s most advanced products with a letter, without written evidence and without a transparent process, then the regulatory risk on any frontier model is much higher than investors had priced in.
Per gli altri player AI, il punto non e' semplicemente competitivo. E' sistemico. Se il criterio regolatorio diventasse “un jailbreak parziale basta per ritirare un modello”, nessun laboratorio di frontiera potrebbe considerarsi immune. Ogni modello abbastanza capace ha superfici di rischio, e ogni comunicazione pubblica sui rischi potrebbe diventare parte del caso regolatorio contro di lui.
For other AI players, the point is not simply competitive. It is systemic. If the regulatory threshold becomes “a partial jailbreak is enough to pull a model,” no frontier lab can assume immunity. Every sufficiently capable model has risk surfaces, and every public communication about those risks could become part of the regulatory case against it.
C'e' poi un secondo livello di ambiguita' istituzionale: secondo la copertura di Axios e Reuters, Anthropic era gia' dentro una tensione con il governo USA, tra interesse pubblico per le sue capacita' cyber e preoccupazioni di supply-chain risk. Il messaggio che arriva al mercato e' complesso: il governo puo' voler usare una tecnologia, temerla e limitarla quasi nello stesso momento.
TechCrunch also notes a second irony: the parallel lawsuit between Anthropic and the Pentagon — a government order blocking federal agencies from using Anthropic’s AI tools — had been blocked by a judge. Those same government agencies could still use Anthropic while the lawsuit was ongoing. Two proceedings, two opposite directions.
Causa 1 (Pentagon vs Anthropic): Il governo aveva emesso un ordine che vietava alle agenzie federali di usare i tool AI di Anthropic. Un giudice ha bloccato quell'ordine: le agenzie governative e le organizzazioni che lavorano con l'US military possono ancora usare Anthropic mentre il lawsuit continua.
Direttiva del 12 giugno (Commerce Dept): Nessuna causa ancora depositata al momento della redazione. Anthropic ha dichiarato l'intenzione di condividere maggiori dettagli nelle 24 ore successive.
Case 1 (Pentagon vs Anthropic): The government had issued an order banning federal agencies from using Anthropic’s AI tools. A judge blocked that order: government agencies and organizations working with the U.S. military can still use Anthropic while the lawsuit continues.
June 12 Directive (Commerce Dept): No lawsuit filed as of writing. Anthropic stated its intention to share more details in the 24 hours following.
Cosa e' in gioco — e dove si va da qui
What Is at Stake — and Where This Goes
Il caso Anthropic-governo USA tocca tre questioni fondamentali che il settore AI non puo' piu' evitare.
The Anthropic-U.S. government case touches three fundamental questions the AI sector can no longer avoid.
1. Chi ha il potere di bloccare un modello AI — e con quali criteri?
1. Who Has the Power to Block an AI Model — and by What Criteria?
Al momento, la risposta e' “il governo americano, con una lettera, senza prove scritte e senza un processo predefinito.” Anthropic ha chiesto esplicitamente un sistema che sia “transparent, fair, clear, and grounded in technical facts.” Nessuna di queste caratteristiche ha descritto il processo del 12 giugno. La precedenza che si sta creando e' pericolosa per tutto il settore: se basta la comunicazione verbale di un jailbreak per disabilitare un modello con centinaia di milioni di utenti, allora nessun modello di frontiera e' al sicuro.
At present, the answer is “the U.S. government, with a letter, without written evidence and without a predefined process.” Anthropic explicitly requested a system that is “transparent, fair, clear, and grounded in technical facts.” None of those characteristics described the June 12 process. The precedent being created is dangerous for the entire sector: if verbal communication of a jailbreak is enough to disable a model with hundreds of millions of users, then no frontier model is safe.
2. La strategia della sicurezza comunicata e' una spada a doppio taglio
2. Communicated Safety Is a Double-Edged Sword
Anthropic ha scelto di essere il laboratorio che comunica i rischi. Ha spiegato cosa Mythos sa fare. Ha descritto i pericoli. Ha chiesto allo stakeholder pubblico di fidarsi del suo approccio cauto. Quello stesso discorso pubblico si e' trasformato nell'evidenza che il governo americano ha usato per giustificare l'intervento. Il paradosso e' reale: la trasparenza sulla pericolosita' di un modello crea il rischio di attirare una risposta regolamentare sproporzionata. Il silenzio sarebbe stato piu' sicuro — ma meno etico.
Anthropic chose to be the lab that communicates risks. It explained what Mythos can do. It described the dangers. It asked the public stakeholder to trust its cautious approach. That same public discourse became the evidence the U.S. government used to justify its intervention. The paradox is real: transparency about a model’s danger creates the risk of attracting a disproportionate regulatory response. Silence would have been safer — but less ethical.
3. La geopolitica dell'AI non aspetta le linee guida
3. AI Geopolitics Doesn't Wait for Guidelines
Mentre Fable 5 e Mythos 5 restano offline, il resto del mondo non si ferma. E qui nasce il nodo geopolitico: se gli Stati Uniti limitano in modo brusco i propri modelli di frontiera per ragioni di sicurezza interna, devono anche evitare di indebolire proprio gli operatori che dovrebbero mantenere il vantaggio tecnologico occidentale. La risposta al rischio cyber non puo' diventare, per errore, un regalo competitivo a chi non applica gli stessi standard.
While Fable 5 and Mythos 5 remain offline, the rest of the world does not stop. That is the geopolitical knot: if the United States sharply limits its own frontier models for domestic security reasons, it also has to avoid weakening the very operators expected to preserve the West’s technological edge. The response to cyber risk cannot accidentally become a competitive gift to actors that do not apply the same standards.
Fonti principali e contesto verificato
- Anthropic — Statement on Fable 5 / Mythos 5 directive
- Anthropic — Claude Fable 5 and Claude Mythos 5 launch post
- Anthropic — Expanding Project Glasswing
- Anthropic — Confidential draft S-1 submission
- Reuters — Commerce directive confirmation
- Axios — Initial directive report
- Axios — 90-minute takedown timeline
- TechCrunch — Safety-warning analysis





