EVO 2, il modello di IA che prevede le mutazioni e crea genomi interi

Analisi della sequenza genomica (Depositphotos foto) - www.sciencecue.it
Un modello di intelligenza artificiale riuscirà a prevedere le mutazioni geniche e creerà interi patrimoni genetici.
Si chiama EVO 2 ed è un innovativo modello di intelligenza artificiale sviluppato dai ricercatori dell’Arc Institute, della Stanford University e di NVIDIA, progettato per rivoluzionare la biologia computazionale. Questo modello avanzato è stato addestrato su un vastissimo dataset di 9,3 mila miliardi di coppie di basi di DNA, tratto da un atlante genomico altamente curato che copre tutti i domini della vita.
La sua principale capacità è quella di prevedere gli effetti delle mutazioni genetiche e generare sequenze genomiche ex novo, aprendo nuove prospettive nella ricerca e nell’ingegneria genetica. L’approccio di EVO 2 è paragonabile a quello dei modelli linguistici come ChatGPT, ma applicato al DNA. Durante l’addestramento, il modello ha imparato a prevedere la coppia di basi successiva in una sequenza genomica, proprio come i modelli linguistici prevedono la parola successiva in una frase.
Questa capacità consente di identificare strutture genetiche complesse e di modellare con precisione l’impatto funzionale delle variazioni genetiche. Grazie a questa tecnologia, i ricercatori possono ora esplorare e progettare il genoma con una precisione senza precedenti. Uno degli aspetti più rivoluzionari di EVO 2 è la sua accuratezza nella predizione degli effetti funzionali delle mutazioni nei genomi di procarioti ed eucarioti.
I test hanno dimostrato che il modello è in grado di identificare con sensibilità le mutazioni nei codoni di inizio, nei siti di splicing e nelle regioni genomiche conservate, rispettando i vincoli biologici noti. Questo significa che può essere utilizzato per studiare mutazioni legate a malattie genetiche, migliorando la comprensione delle basi molecolari di molte patologie.
Generare genomi
Un altro risultato impressionante di EVO 2 è la sua capacità di generare sequenze genomiche su larga scala. Il modello ha già dimostrato di poter creare genomi mitocondriali completi, genomi batterici e persino sequenze cromosomiche di lievito.
Inoltre, è stato in grado di riscrivere il genoma del mammut lanoso a partire da sequenze genomiche grezze, senza un riferimento di apprendimento diretto. Questo suggerisce che EVO 2 è in grado di generalizzare la funzione genomica semplicemente a partire dalle sequenze di DNA, aprendo la strada alla ricostruzione di specie estinte o alla progettazione di organismi geneticamente ottimizzati.

Una risorsa disponibile per tutti
Un aspetto particolarmente rilevante di EVO 2 è la sua apertura alla comunità scientifica. I suoi sviluppatori hanno deciso di rendere il modello completamente open-source, condividendo non solo il codice di training e inferenza, ma anche i parametri del modello e il dataset OpenGenome2. Questa scelta è motivata dalla volontà di accelerare la ricerca e l’innovazione nel campo della biologia computazionale, permettendo a laboratori di tutto il mondo di sfruttare questa tecnologia per nuove scoperte.
In sintesi, EVO 2 rappresenta un importante passo avanti nell’intelligenza artificiale applicata alla genomica. Con le sue capacità predittive e generative su scala genomica, questo modello promette di rivoluzionare la biologia sintetica, la ricerca genetica e la medicina di precisione, aprendo nuove possibilità per la comprensione e la manipolazione del genoma umano e di altre forme di vita.