Un database raccoglie 25 anni di ricerche su 20.000 geni: resta sconosciuta la funzione di 3.600 di essi

Illustrazione di un genoma incompleto (Pixabay FOTO9 - www.sciencecue.it
Studiare un genoma non è mai semplice, ma in questo caso abbiamo fatto passi da gigante studiando 20.000 geni.
Se c’è una cosa che sappiamo sulla genetica umana, è che sappiamo ancora troppo poco. Certo, negli ultimi decenni abbiamo fatto passi da gigante nel decifrare il nostro genoma (DNA mitocondriale più DNA nucleare), ma resta ancora un gran numero di geni di cui ignoriamo la funzione esatta. Finalmente, però, c’è una svolta: un nuovo database, appena pubblicato, promette di essere la risorsa definitiva per capire a cosa servano più di 20.000 geni umani.
Questo progetto monumentale arriva dal Gene Ontology Consortium, un gruppo di ricerca che da oltre 25 anni raccoglie, organizza e aggiorna le informazioni sulla funzione dei geni umani e di altri organismi. E adesso, grazie a un mix di modelli evolutivi e analisi su larga scala, hanno creato un’enciclopedia completa delle funzioni geniche umane.
Il risultato? Un’enorme banca dati accessibile al pubblico, dove si possono consultare le informazioni più aggiornate e dettagliate sui geni, basate non solo su esperimenti sugli esseri umani, ma anche su studi condotti su altre specie, come topi e zebrafish.
Questo perché, molti dei nostri geni, sono presenti anche in altri organismi. Ed è proprio sfruttando questa parentela evolutiva che gli scienziati sono riusciti a colmare molte lacune.
Come si costruisce “un’enciclopedia del DNA”?
Immagina di dover mettere insieme il puzzle più grande del mondo, senza sapere esattamente che immagine dovrebbe venire fuori. Questo è più o meno ciò che hanno fatto i ricercatori: hanno preso tutte le informazioni disponibili sui geni umani, le hanno integrate con i dati provenienti da altre specie e le hanno inserite in un modello evolutivo che traccia l’origine e la funzione di ogni gene. Per farlo, hanno analizzato più di 175.000 pubblicazioni scientifiche, raccogliendo dati sperimentali e categorizzando ogni gene in base alle sue funzioni biologiche. Hanno poi utilizzato modelli computazionali avanzati per identificare i legami tra i geni umani e quelli di altre specie.
Questo ha permesso di capire quali funzioni erano già presenti nei primi organismi viventi e quali sono emerse con l’evoluzione degli esseri umani. Il risultato è un database dettagliatissimo, chiamato PAN-GO Functionome, che non solo elenca le funzioni dei geni, ma ne racconta anche la storia evolutiva. Ad esempio, se un gene ha una funzione simile in un batterio e in un essere umano, il database può indicare quando quella funzione è comparsa per la prima volta nella storia della vita sulla Terra. E la cosa interessante è che questa risorsa non è solo statica: gli scienziati possono aggiornarla e migliorarla continuamente, grazie ai contributi di tutta la comunità scientifica. Insomma, una sorta di Wikipedia genetica, ma con il rigore della scienza.

Perché è una rivoluzione per la medicina e per la biologia evolutiva?
Ok, bello tutto questo, ma a cosa serve davvero? La risposta è semplice: sapere esattamente come funzionano i nostri geni è fondamentale per capire le malattie e sviluppare nuove cure. Facciamo un esempio pratico. Supponiamo che un gruppo di ricercatori scopra che un determinato gene si attiva in modo anomalo nei pazienti con una forma rara di tumore. Prima di questo nuovo database, avrebbero dovuto scavare tra migliaia di pubblicazioni per capire quale fosse il ruolo di quel gene, cosa facesse in condizioni normali e quali fossero le sue interazioni con altri geni. Adesso, invece, possono semplicemente consultare il PAN-GO Functionome e ottenere una sintesi chiara e precisa delle informazioni disponibili.
Ma non si tratta solo di malattie. Anche la ricerca sulle malattie genetiche rare, sulle terapie personalizzate e persino sull’invecchiamento beneficerà enormemente di questo database. E c’è di più: poiché il sistema è strutturato in un formato leggibile dalle macchine, gli algoritmi di intelligenza artificiale possono usarlo per analizzare enormi quantità di dati in pochissimo tempo. E questo, dal punto di vista evoluzionistico, è davvero una grandissima notizia in quanto sarebbe possibile costruire parentele un po’ più precise e capire come funzionano certi geni nei vari gruppi. Certo, non è ancora perfetto: il database copre l’82% dei geni umani conosciuti, il che significa che ci sono ancora circa 3.600 geni di cui non sappiamo quasi nulla.