Intervista a Giovanni Morelli: “uno sguardo nuovo e rivoluzionario”
Ormai è un dato certo: la bioinformatica, nei prossimi anni, condizionerà in modo determinante il progresso tecnico-scientifico della nostra società. Si tratta di una scienza fortemente interdisciplinare, che mescola saperi e competenze per espandere la nostra conoscenza del mondo biologico, soprattutto per quanto concerne gli aspetti strutturali e funzionali dei suoi componenti. Una disciplina che chiede alle scienze matematiche, fisiche e naturali di uscire dal loro isolamento per mescolarsi e produrre dati, informazione e conoscenza.
Gli ambiti nei quali questa scienza trova la sua naturale collocazione vanno dalla genetica, alla biologia molecolare, dalla ricerca farmacologica generale a quella specifica immunologica e virale: è ovvio quindi, come la bioinformatica assume un’importanza strategica specie in tempi di Coronavirus.
Abbiamo intervistato Gianni Morelli, chimico teorico di formazione che da anni si occupa di High Performance Computing (calcolo ad alte prestazioni ndr) anche in ambito bioinformatico.
Si parla molto in queste settimane di bioinformatica o di biologia computazionale, legata soprattutto alla ricerca del vaccino sul Covid-19. Ci fa capire innanzitutto di cosa si occupa questa disciplina e perchè è ritenuta così importante in questo periodo?
La scoperta del DNA, della sua struttura e delle sue funzioni, è stata una delle maggiori rivoluzioni scientifiche dell’ultimo secolo: a partire da allora la biologia, soprattutto quella molecolare, non ha mai smesso di studiare “la doppia elica”. Tuttavia soltanto da pochi decenni, ovvero solo dopo la nascita, lo sviluppo e l’esplosione della tecnologia informatica è stato possibile raggiungere livelli di conoscenza inimmaginabili intorno a questa macromolecola e le sue funzioni ed il motivo è relativamente semplice; le sue unità fondamentali (coppie di basi) sono approssimativamente 3,2 miliardi nel caso del genoma umano: trattare qualsiasi problema di queste dimensioni senza un supporto computazionale pone dei limiti che sono facilmente intuibili. Questo non significa che il DNA non sia stato studiato prima dell’avvento dei calcolatori, assolutamente, bensì che il grado di conoscenza raggiunto su di esso è inimmaginabile al di fuori delle tecniche computazionali.
Può spiegarci meglio il perché?
Ci provo, con un esempio. Supponiamo di voler “comprendere” il contenuto di un testo molto importante, per esempio la “Critica della ragion pura” di Immanuel Kant.
Guardando il libro “chiuso” e leggendo solo il suo titolo posso già “comprendere” un sacco di cose: è sicuramente un testo filosofico (Critica) che si occupa di analizzare il tema della ragione, del ragionamento e magari più in generale della conoscenza. Tuttavia, se vogliamo capire qualcosa di più, “ancor prima di leggerlo”, dobbiamo cominciare a dare uno sguardo all’indice e “leggere” i titoli dei “capitoli”: per quanto sommaria, l’idea sull’opera si arricchirà. Ogni capitolo presenta un certo numero di paragrafi ed i loro titoli assieme all’organizzazione nei rispettivi capitoli ci fornisce un’idea sulla “struttura del libro”; se poi abbiamo una qualche “competenza filosofica”, allora possiamo intuire le “intenzioni dell’opera”.
Il passo successivo consiste nella lettura integrale del libro, parola per parola. Quando saremo arrivati a questo livello di conoscenza, dovremo cominciare a “studiare”: isolare concetti, stabilire nessi, elaborare delle sintesi, organizzare degli schemi e magari individuare frasi di senso compiuto in grado di “esprimere” i concetti fondamentali, una sorta di aforismi. Ecco, con il DNA è stato fatto più o meno la stessa cosa: prima si è guardato al libro nel suo insieme (cromatina e cromosomi), poi lo si è aperto e si è data una sbirciata all’indice (struttura a doppia elica), poi si è sceso a livello dei paragrafi (struttura primaria) fino a leggere tutte le sue parole (sequenziamento del genoma).
Come per la maggior parte di libri “impegnativi”, la lettura integrale del testo è condizione necessaria ma non sufficiente per capirlo fino in fondo. Se consideriamo il DNA come un grosso libro, pieno di parole, frasi, aforismi allora possiamo dire di essere riusciti a leggerlo per intero, senza averlo, tuttavia, ancora compreso fino in fondo.
Negli ultimi decenni si sono compiuti risultati straordinari, continuando con la metafora del libro, sono state “isolate” alcune frasi fondamentali, costituite da gruppi di parole che chiamiamo “geni”, di cui si è compreso molto bene il significato; gli aforismi della vita!
La bioinformatica, mettendo insieme conoscenze chimiche, biologiche, fisiche, matematiche ed informatiche è riuscita nell’opera titanica di leggere un “testo molecolare” composto da 3,2 miliardi di parole: tanto per fare un confronto, “I miserabili” di Victor Hugo, di parole, ne contiene 530982.
E’ questo, e molto di più e più preciso, il processo di comprensione condotto dalla bioinformatica, un processo tuttora in corso: l’opera da “leggere” è molto complessa e svelarne i misteri, gli intrighi, le innumerevoli connessioni con il mondo intracellulare ed extracellulare costituisce una delle maggiori e affascinanti sfide per l’intelletto umano.
Quali contributi specifici può fornire la Bioinformatica nella lotta al Covid-19 ?
Un virus è essenzialmente materiale genetico allo stato puro. E’ un corpuscolo dotato di una sola capacità: veicolare informazione; quella per riprodursi. La “ricetta” per adempiere a questo unico scopo è depositata nel materiale genetico che veicola (sotto forma di DNA o RNA contenuto in un involucro lipoproteico), eppure da solo non ha nessuna possibilità di realizzarla: per questo infetta le cellule degli organismi superiori, si serve del loro “laboratorio di sintesi” per realizzare la sua unica ricetta. Ora, i modi ed i mezzi attraverso cui viene sferrato questo attacco sono abbastanza noti alla biologia molecolare; tuttavia ogni virus ha una sua “specificità” che bisogna innanzitutto conoscere per poi progettare rimedi molecolari altrettanto specifici: la bioinformatica svolge un ruolo determinante in entrambe queste fasi. Il principale soggetto di studio è supporto molecolare costituito da una enorme quantità di informazione, ovvero una fonte smisurata di dati: da questo punto di vista la bioinformatica si configura anche come la scienza dei dati applicata ai contesti biologici. Non è un caso che molti paradigmi del Data Analytics (la scienza dell’analisi dei dati) si utilizzano anche in biologia computazionale, sollevando la questione cruciale delle competenze squisitamente tecnologiche coinvolte nel campo bioinformatico: le architetture di calcolo parallelo, la virtualizzazione, i workflow basati su containers, il GPU computing, i filesystem distribuiti per gestire (archiviare e accedere) enormi quantità di dati sono solo alcuni degli aspetti tecnologici coinvolti nelle attività di ricerca e produzione bioinformatica e, per i quali, sono richieste competenze verticali di altro profilo.
In quali altre applicazioni la bioinformatica diventa una scienza necessaria ed inevitabilmente efficace?
L’incontro della biologia molecolare tradizionale con le moderne risorse computazionali ha di fatto reso relativamente semplice “accedere” alle informazioni genetiche: sia in termini di tempi che di costi. Questi aspetti hanno reso la bioinformatica uno strumento diagnostico irrinunciabile. Non solo. Accedere alle informazioni genetiche relative ad uno specifico paziente, apre le porte alla realizzazione di farmaci “costruiti” su misura: è il tema centrale della medicina personalizzata. La bioinformatica poi, non è solo genetica, ma anche dinamica molecolare, docking di proteine, ricostruzione di processi cellulari molecolari, delle funzioni proteiche specifiche, etc… E’ chiaro che la comprensione profonda di ognuno di questi aspetti apre nuove ed immense possibilità, soprattutto alla medicina, sia in termini di diagnosi che di cura: ci sono patologie che solo da qualche anno cominciamo a guardare con uno sguardo nuovo e rivoluzionario….proprio grazie alla bioinformatica.