Home » EVO 2, il modello di IA che prevede le mutazioni e crea genomi interi

EVO 2, il modello di IA che prevede le mutazioni e crea genomi interi

Analisi della sequenza genomica

Analisi della sequenza genomica (Depositphotos foto) - www.sciencecue.it

Un modello di intelligenza artificiale riuscirà a prevedere le mutazioni geniche e creerà interi patrimoni genetici.

Si chiama EVO 2 ed è un innovativo modello di intelligenza artificiale sviluppato dai ricercatori dell’Arc Institute, della Stanford University e di NVIDIA, progettato per rivoluzionare la biologia computazionale. Questo modello avanzato è stato addestrato su un vastissimo dataset di 9,3 mila miliardi di coppie di basi di DNA, tratto da un atlante genomico altamente curato che copre tutti i domini della vita.

La sua principale capacità è quella di prevedere gli effetti delle mutazioni genetiche e generare sequenze genomiche ex novo, aprendo nuove prospettive nella ricerca e nell’ingegneria genetica. L’approccio di EVO 2 è paragonabile a quello dei modelli linguistici come ChatGPT, ma applicato al DNA. Durante l’addestramento, il modello ha imparato a prevedere la coppia di basi successiva in una sequenza genomica, proprio come i modelli linguistici prevedono la parola successiva in una frase.

Questa capacità consente di identificare strutture genetiche complesse e di modellare con precisione l’impatto funzionale delle variazioni genetiche. Grazie a questa tecnologia, i ricercatori possono ora esplorare e progettare il genoma con una precisione senza precedenti. Uno degli aspetti più rivoluzionari di EVO 2 è la sua accuratezza nella predizione degli effetti funzionali delle mutazioni nei genomi di procarioti ed eucarioti.

I test hanno dimostrato che il modello è in grado di identificare con sensibilità le mutazioni nei codoni di inizio, nei siti di splicing e nelle regioni genomiche conservate, rispettando i vincoli biologici noti. Questo significa che può essere utilizzato per studiare mutazioni legate a malattie genetiche, migliorando la comprensione delle basi molecolari di molte patologie.

Generare genomi

Un altro risultato impressionante di EVO 2 è la sua capacità di generare sequenze genomiche su larga scala. Il modello ha già dimostrato di poter creare genomi mitocondriali completi, genomi batterici e persino sequenze cromosomiche di lievito.

Inoltre, è stato in grado di riscrivere il genoma del mammut lanoso a partire da sequenze genomiche grezze, senza un riferimento di apprendimento diretto. Questo suggerisce che EVO 2 è in grado di generalizzare la funzione genomica semplicemente a partire dalle sequenze di DNA, aprendo la strada alla ricostruzione di specie estinte o alla progettazione di organismi geneticamente ottimizzati.

AI robot decodifica dati
AI robot decodifica dati (Depositphotos foto) – www.sciencecue.it

Una risorsa disponibile per tutti

Un aspetto particolarmente rilevante di EVO 2 è la sua apertura alla comunità scientifica. I suoi sviluppatori hanno deciso di rendere il modello completamente open-source, condividendo non solo il codice di training e inferenza, ma anche i parametri del modello e il dataset OpenGenome2. Questa scelta è motivata dalla volontà di accelerare la ricerca e l’innovazione nel campo della biologia computazionale, permettendo a laboratori di tutto il mondo di sfruttare questa tecnologia per nuove scoperte.

In sintesi, EVO 2 rappresenta un importante passo avanti nell’intelligenza artificiale applicata alla genomica. Con le sue capacità predittive e generative su scala genomica, questo modello promette di rivoluzionare la biologia sintetica, la ricerca genetica e la medicina di precisione, aprendo nuove possibilità per la comprensione e la manipolazione del genoma umano e di altre forme di vita.