Agevolazioni e Iniziative
Partnership
Stay Connected

Learn Anything Anywhere

Red Queen Gödel Machine: l’AI che si auto-migliora
Ufficio moderno con visione creativa digitale

Red Queen Gödel Machine: l’AI che si auto-migliora

Red Queen Gödel Machine: l’AI che si auto-migliora

La Red Queen Gödel Machine è un metodo, proposto in un preprint di giugno 2026 da ricercatori legati all’Università di Cambridge e a NVIDIA, per costruire agenti di intelligenza artificiale capaci di migliorare sé stessi facendo evolvere, allo stesso tempo, anche i criteri con cui vengono giudicati. Detta così sembra un tecnicismo. In realtà tocca uno dei nodi più vecchi e più affascinanti dell’informatica: può una macchina riscrivere il proprio codice per diventare più brava, senza che un essere umano le dica come? E soprattutto: come fa a sapere di essere migliorata, se il metro di giudizio lo decide sempre qualcun altro?

Prima di entrare nel merito, una premessa doverosa che troppi articoli divulgativi saltano. Quello di cui parliamo è un preprint, cioè un documento scientifico pubblicato su arXiv ma non ancora sottoposto a revisione paritaria (la cosiddetta peer review). Gli stessi autori lo definiscono “lavoro in corso, versione preliminare”. Non è un risultato consolidato: è una proposta interessante che il resto della comunità scientifica dovrà controllare, replicare e mettere alla prova. Lo teniamo a mente per tutto l’articolo, perché cambia il modo in cui vanno letti i numeri che troverete più avanti.

Un’idea rimasta ferma per vent’anni

Per capire cosa c’è di nuovo, bisogna tornare al 2003. In quell’anno l’informatico Jürgen Schmidhuber descrisse una macchina teorica che chiamò Gödel Machine, in omaggio al matematico Kurt Gödel e ai suoi teoremi sulla logica formale. L’idea era semplice da enunciare e vertiginosa da realizzare: un sistema in grado di riscrivere qualsiasi parte del proprio codice — comprese le istruzioni che gli dicono come riscriversi — a patto di riuscire prima a dimostrare, in modo matematicamente rigoroso, che la modifica lo avrebbe reso migliore.

La trappola della dimostrazione

Qui sta il punto debole, ed è un punto debole grosso. Per applicare una modifica, la Gödel Machine originale doveva provare logicamente, con una dimostrazione formale valida, che quel cambiamento avrebbe aumentato la sua utilità futura. Non “immaginare che”, non “verificare su qualche esempio che”: dimostrare. In matematica una dimostrazione di questo tipo è un oggetto costoso, e per problemi realistici diventa di fatto impossibile da produrre in tempi e risorse ragionevoli.

Il risultato è che per oltre vent’anni la Gödel Machine è rimasta quello che in gergo si chiama un esperimento mentale: un tetto teorico, elegante e irraggiungibile, verso cui guardare senza mai poterlo toccare. Bellissima sulla carta, inservibile nella pratica. Un po’ come il motore a moto perpetuo, ma per l’informatica.

Cosa cambia con l’approccio evolutivo

Il contributo del gruppo di ricerca dietro la Red Queen Gödel Machine (abbreviata in RQGM nel paper) è aver cambiato la domanda. Invece di chiedersi “come faccio a dimostrare che una modifica è sicura al cento per cento”, i ricercatori si sono chiesti: “e se lasciassimo che sia l’evoluzione a selezionare le modifiche buone, come fa la natura con le specie viventi?”.

È un cambio di filosofia netto. Si abbandona la certezza logica assoluta e si abbraccia un meccanismo darwiniano. Il sistema genera molte varianti di sé stesso — diverse versioni dei propri prompt e dei propri workflow, cioè delle istruzioni e delle procedure con cui l’agente affronta i compiti. Le mette alla prova. Scarta quelle che falliscono, tiene quelle che funzionano. Le sopravvissute generano a loro volta nuove varianti. E così via, in un ciclo di auto-miglioramento ricorsivo che non richiede più alcuna dimostrazione formale: richiede solo un modo per misurare chi ha lavorato meglio.

Il vero problema non è migliorare, è misurare

Ed è proprio sul “modo per misurare” che si gioca la partita. Tutti i sistemi di agenti auto-miglioranti costruiti finora avevano un limite nascosto: davano per scontato che il metro di giudizio restasse fisso. Un test, un benchmark, un insieme di dati etichettati che rimane valido mentre l’agente cambia. Nel paper questa assunzione viene chiamata criterio di valutazione stazionario, ed è esattamente ciò che gli autori considerano il difetto da superare.

Il problema è intuitivo se ci pensate. Immaginate uno studente bravissimo a cui somministrate sempre lo stesso test. Dopo un po’ lo memorizza, prende il massimo dei voti e smette di imparare qualcosa di nuovo. Il test non misura più la sua bravura reale: misura solo quanto bene ha imparato quel test. Con l’AI succede la stessa identica cosa. Quando un modello “satura” un benchmark, arrivando al punteggio massimo, quel benchmark diventa cieco. Non riesce più a distinguere un sistema mediocre da uno eccellente, perché entrambi lo superano.

L’ipotesi della Regina Rossa applicata alle macchine

Il nome del metodo viene da una teoria della biologia evolutiva formulata negli anni Settanta: l’ipotesi della Regina Rossa, introdotta dal biologo Leigh Van Valen nel 1973. Il riferimento è a Attraverso lo specchio di Lewis Carroll, dove la Regina Rossa spiega ad Alice che in quel paese bisogna correre a più non posso solo per restare fermi.

In biologia significa questo: le specie sono impegnate in una corsa agli armamenti perpetua. La gazzella diventa più veloce perché il ghepardo diventa più veloce, e viceversa. Nessuno dei due “vince” definitivamente, ma entrambi migliorano di continuo proprio perché l’avversario non sta fermo. Se il predatore smettesse di evolvere, la preda non avrebbe più pressione a migliorare, e viceversa.

Il lavoratore e il giudice che crescono insieme

La RQGM prende questa idea e la traduce in software. Da una parte c’è l’agente che svolge il compito — chiamiamolo il lavoratore. Dall’altra c’è un secondo modello di intelligenza artificiale che ha il ruolo di giudice (nel paper, agent-as-a-judge), incaricato di valutare quanto bene ha lavorato il primo.

Il colpo di reni è tenere entrambi in movimento. Man mano che il lavoratore diventa più bravo, anche il giudice co-evolve, diventando più severo e più capace di cogliere errori sottili. Se il giudice restasse fermo, il lavoratore lo “saturerebbe” in fretta e smetterebbe di crescere, esattamente come lo studente con il test memorizzato. Tenendoli agganciati in un ciclo continuo e per certi versi conflittuale, ciascuno costringe l’altro ad alzare l’asticella. La valutazione, insomma, smette di essere un giudice esterno e diventa parte del processo di miglioramento.

Come si evita il caos: le epoche

Un lettore attento a questo punto si insospettisce, e fa bene. Se lascio cambiare contemporaneamente sia chi lavora sia chi giudica, come faccio a sapere che sto davvero migliorando e non semplicemente inseguendo un bersaglio mobile senza senso? Potrei ritrovarmi con un lavoratore e un giudice che si accordano su una definizione di “bravo” completamente scollegata dalla realtà.

Gli autori rispondono con un accorgimento che chiamano controlled utility evolution, ovvero evoluzione controllata dell’obiettivo. La ricerca è organizzata in fasi, chiamate epoche. Dentro una singola epoca il criterio di valutazione resta fisso: il lavoratore evolve, il giudice no. Solo al confine tra un’epoca e la successiva il criterio può essere aggiornato. In questo modo, dicono, le garanzie di miglioramento valgono all’interno di ciascuna epoca, anche mentre l’obiettivo complessivo cambia da un’epoca all’altra. È il compromesso che tiene insieme la libertà dell’evoluzione con un minimo di rigore: non la dimostrazione assoluta della Gödel Machine originale, ma nemmeno il far west.

Cosa dice il paper di aver ottenuto

Veniamo ai risultati, con la prudenza che il caso richiede. I ricercatori hanno testato la Red Queen Gödel Machine su tre terreni molto diversi tra loro. Riporto i numeri così come compaiono nell’abstract del documento, ricordando che sono numeri di un preprint e che, come vedremo, il modo in cui sono stati ottenuti va guardato con attenzione.

Scrittura di codice

Sul terreno più “misurabile”, quello della programmazione, il sistema ha migliorato il tasso di test superati rispetto al precedente stato dell’arte. Come? Aggiungendo un segnale di valutazione complementare: un secondo agente che fa da revisore del codice, una sorta di peer review automatizzata costruita dal sistema stesso. Il dettaglio interessante è l’efficienza: secondo il paper questo segnale è meno costoso, e la RQGM arriva al risultato usando tra 1,35 e 1,72 volte meno token rispetto all’approccio precedente. Meno token significa meno calcolo, quindi meno energia e meno costi. In un settore dove ogni interrogazione a un modello ha un prezzo concreto, non è un dettaglio da poco.

Scrittura scientifica e revisione dei paper

Il secondo campo di prova è la scrittura di articoli scientifici e la loro valutazione. Qui il paper riporta che gli agenti-scrittori fatti co-evolvere raggiungono un tasso di accettazione da 1,78 a 1,86 volte più alto, quando i loro lavori vengono giudicati da un gruppo variegato di giudici AI. In parallelo, i sistemi di valutazione co-evoluti avrebbero migliorato del 9% la loro accuratezza rispetto al giudizio “vero” di riferimento.

Matematica da olimpiadi

Il terzo terreno è la scrittura e la valutazione di dimostrazioni matematiche di livello olimpico — problemi difficili, di quelli da competizione internazionale. Anche qui la logica è la stessa: far co-evolvere sia chi scrive la dimostrazione sia chi la corregge, con un miglioramento riportato nell’accuratezza di correzione.

Il risultato più curioso: smascherare l’indulgenza dell’AI

C’è un esperimento nel paper che merita un paragrafo a parte, perché tocca un problema di cui si parlerà sempre di più. È noto che i modelli di intelligenza artificiale usati per valutare testi tendono a essere indulgenti verso i contenuti generati da altre AI. In parole povere: un’AI che fa da revisore accetta più facilmente un testo scritto da un’AI di quanto un revisore umano farebbe con lo stesso testo.

Il paper quantifica questa distorsione: il miglior revisore di riferimento tra quelli testati accetta paper generati dall’AI a un tasso fino a 1,91 volte superiore rispetto al tasso con cui li accetterebbe un valutatore umano. Quasi il doppio. È una forma di favoritismo tra macchine che, se lasciata correre, rischia di riempire il web e la letteratura di contenuti mediocri promossi da giudici troppo teneri.

Un giudice severo per pareggio

La RQGM, secondo gli autori, corregge questo squilibrio introducendo un obiettivo adversariale: invece di premiare il giudice quando è d’accordo con il lavoratore, lo si spinge attivamente a scovare le debolezze. Il risultato è l’emergere di un revisore ugualmente rigoroso sia con il lavoro scritto da un’AI sia con quello scritto da una persona. Un giudice che non fa sconti a nessuno, indipendentemente da chi ha tenuto la penna. Se il dato regge alla verifica, è una direzione promettente per un problema molto concreto.

Il grande avvertimento: chi giudica i giudici?

Ed eccoci al punto che nessun articolo onesto su questo tema può nascondere sotto il tappeto. La maggior parte dei numeri brillanti che avete letto qui sopra — i tassi di accettazione più alti, l’accuratezza migliorata — sono stati misurati usando altri modelli di intelligenza artificiale come giudici, non esclusivamente valutatori umani indipendenti su ogni fronte.

Questo introduce una circolarità di cui bisogna essere consapevoli. Se un sistema AI viene giudicato “migliore” da un altro sistema AI, dobbiamo chiederci quanto quel giudizio corrisponda a un miglioramento reale, percepibile da un essere umano, e quanto invece sia il prodotto delle stesse dinamiche interne al mondo dei modelli. È lo stesso identico bias di indulgenza che il paper si vanta di correggere in un esperimento, e che potrebbe però influenzare la lettura degli altri. Gli autori ne sono consapevoli — non a caso costruiscono l’esperimento del “giudice severo” — ma per il lettore vale la regola aurea: quando i risultati sono validati principalmente da AI su AI, la barra di prudenza va alzata.

Perché scrivere “propongono” e non “hanno dimostrato”

C’è una ragione precisa per cui in questo articolo trovate espressioni come “il paper riporta”, “secondo gli autori”, “se il dato regge”. Un preprint non è una verità acquisita. È l’inizio di una conversazione scientifica, non la sua conclusione. La differenza tra “i ricercatori hanno dimostrato che l’AI si auto-migliora” e “i ricercatori propongono un metodo con cui l’AI potrebbe auto-migliorarsi, con risultati preliminari incoraggianti” non è pignoleria: è la differenza tra informare e disinformare. Chi divulga tecnologia ha il dovere di tenere questa distinzione ben ferma, soprattutto su temi che si prestano facilmente all’allarmismo o all’entusiasmo esagerato.

Serve preoccuparsi? La verità senza fantascienza

La reazione istintiva, leggendo di un’AI che riscrive il proprio codice per migliorarsi, è quella da film: la macchina che sfugge al controllo, si potenzia da sola e ci lascia indietro. È una narrazione seducente e quasi sempre sbagliata, almeno rispetto a ciò che descrive questo lavoro.

Nella RQGM gli ingegneri umani restano saldamente al comando dell’architettura di fondo e dei confini entro cui il sistema può muoversi — la “sandbox”, cioè il recinto protetto dentro il quale gli esperimenti avvengono senza toccare nulla di importante fuori. Il sistema non riscrive sé stesso in libertà assoluta: fa evolvere prompt e procedure dentro limiti definiti da chi lo ha costruito. Parlare di “perdita di controllo” è, allo stato attuale, pura fantascienza.

Il vero cambiamento è più sottile (e più interessante)

Detto questo, sarebbe un errore liquidare il lavoro come marketing. Il cambiamento reale c’è, ed è più sottile della trama di un film. Fino a oggi il progresso dell’AI è stato vincolato da benchmark e dataset statici, definiti dagli esseri umani. Una volta che un modello arrivava al massimo di un test, sbatteva contro un muro: non c’era più modo di misurare ulteriori progressi su quel terreno.

La Red Queen Gödel Machine suggerisce una via d’uscita da quel muro: lasciare che siano gli obiettivi e i criteri di valutazione a evolvere insieme al sistema. In pratica, l’AI comincia a gestire una parte del proprio “programma di studi”, generando prove sempre nuove e sempre più difficili man mano che diventa più capace. Se questa direzione si consoliderà — e il condizionale resta d’obbligo — sposterà il collo di bottiglia dello sviluppo dell’AI da “quanti test riusciamo a scrivere noi umani” a “quanto bene il sistema sa costruirsi i propri test”. È un cambiamento di prospettiva che vale la pena osservare, con curiosità e senza fretta di concludere.

Domande frequenti

Cos’è la Red Queen Gödel Machine in parole semplici?

È un metodo, descritto in un preprint del 2026, per costruire agenti di intelligenza artificiale che migliorano sé stessi facendo evolvere allo stesso tempo anche il “giudice” che li valuta. In questo modo il sistema non satura mai il proprio metro di misura e continua a imparare, in una corsa continua ispirata all’ipotesi biologica della Regina Rossa.

La Red Queen Gödel Machine è un prodotto che posso usare?

No. È un lavoro di ricerca allo stadio di preprint, cioè un documento scientifico non ancora sottoposto a revisione paritaria. Non è un software commerciale né uno strumento disponibile al pubblico: è una proposta metodologica che la comunità scientifica dovrà ancora verificare e replicare.

Chi ha scritto lo studio sulla Red Queen Gödel Machine?

Il preprint è firmato da un gruppo di ricercatori guidato da Alex Iacob e Nicholas D. Lane, con affiliazioni legate all’Università di Cambridge e a NVIDIA. È stato pubblicato su arXiv il 24 giugno 2026 nella categoria Machine Learning.

Questa AI può davvero riscrivere il proprio codice senza controllo umano?

No, non nel senso allarmistico del termine. Il sistema fa evolvere le proprie istruzioni e procedure all’interno di un ambiente protetto e di confini decisi dagli ingegneri umani, che mantengono il controllo sull’architettura di fondo. L’immagine dell’AI che sfugge al controllo è fantascienza rispetto a ciò che il paper descrive.

Perché bisogna essere prudenti con i risultati dichiarati?

Perché molti dei risultati sono stati misurati usando altri modelli di AI come valutatori, non solo esseri umani indipendenti. Questo introduce una possibile circolarità nel giudizio. Trattandosi inoltre di un preprint non ancora revisionato, i numeri vanno letti come indicazioni preliminari e non come conclusioni definitive.

Fonte primaria: Iacob A., Jovanović A., Shen W. F. et al., The Red Queen Gödel Machine: Co-Evolving Agents and Their Evaluators, arXiv, 24 giugno 2026. Disponibile su arXiv. Documento in versione preliminare (preprint), non sottoposto a revisione paritaria al momento della stesura di questo articolo.

Loading

Lascia un commento

Required fields are marked *