Come l’intelligenza artificiale sta rivoluzionando lo sviluppo dei farmaci

Un tempo la progettazione richiedeva anni. Ora cambia tutto: un’équipe di scienziati racconta che il loro algoritmo ha “disegnato” le molecole giuste in una manciata di secondi

Un’intelligenza artificiale è riuscita a “sognare” e disegnare diverse molecole, la cui progettazione aveva richiesto all’intelligenza umana molti mesi di lavoro, in una manciata di secondi. Lo racconta, in due articoli pubblicati sulla rivista Science (qui e qui), un’équipe di biochimici della University of Washington a Seattle, coordinata da David Baker: la notizia (assieme a quella risalente a circa due mesi fa, quando gli esperti di DeepMind hanno annunciato che l’algoritmo di AlphaFold è riuscito a prevedere la struttura di quasi tutte le proteine note, appena premiata con il prestigioso Breakthrough Prize 2023) rende ancora più concreto e vicino l’inizio di una nuova era nella farmacologia, un’era in cui l’intelligenza artificiale cambierà completamente i tempi e i modi di progettazione e sviluppo delle molecole terapeutiche. 

Perché “disegnare” le proteine è così difficile (e così importante)

Tutto dipende dal fatto che la loro struttura è molto, molto complessa. La struttura tridimensionale delle proteine – composti che sono tra gli elementi costitutivi degli esseri viventi – è strettamente legata alla funzione da esse esercitata: sebbene le singole unità di cui sono fatte, gli amminoacidi, siano soltanto 20, disposti in sequenze precise, in natura esistono milioni di proteine diverse, ciascuna delle quali ha caratteristiche e funzioni differenti. Questo è possibile perché gli amminoacidi si dispongono nello spazio in maniera diversa a seconda delle loro caratteristiche chimiche; pertanto, a ogni sequenza di amminoacidi di cui è costituita una proteina corrisponderà una struttura diversa. Le combinazioni tridimensionali sono tantissime, e solo una parte di esse (un numero comunque altissimo) corrisponde a proteine effettivamente “possibili”: comprendere la configurazione tridimensionale di una proteina è fondamentale nella ricerca, perché fornisce informazioni sulla sua posizione e su come modificarla, bloccarla o regolarla; nel corso degli anni, lo studio della struttura tridimensionale delle proteine ha infatti dimostrato la sua utilità in molte aree delle scienze della vita, tra cui per l’appunto la scoperta e la sintesi di nuovi farmaci.

PUBBLICITÀ

Bisogna tenere conto, inoltre, del fatto che mentre la sequenza di amminoacidi è piuttosto semplice da individuare, non è così scontato ricavarne da essa la struttura tridimensionale: tradizionalmente – ossia prima dell’avvento dell’intelligenza artificiale – si ricorre a tecniche sperimentali che però presentano diversi ostacoli in termini di complessità e tempi di realizzazione. Ottenere una predizione della struttura proteica con un approccio computazionale “classico” finora era possibile con tecnologie bioinformatiche, ma solo per parti limitate della molecola. Quello in cui l’intelligenza artificiale ha trionfato, cambiando completamente le carte in tavola, è stato trovare il modo di ottenere, a partire da una sequenza amminoacidica, una previsione affidabile e in alta risoluzione della struttura di una proteina nella sua interezza. Per dirlo con le parole degli esperti, è come se l’intelligenza artificiale “sognasse” la struttura della proteina una volta conosciuta la sequenza dei suoi componenti. Una sorta di “allucinazione”, insomma.

Il punto di svolta

“Dall’arrivo di AlphaFold – ha spiegato a Nature Noelia Ferruz, biologa computazionale all’Università di Girona, in Spagna – c’è stato un cambio radicale nel nostro modo di lavorare al disegno delle proteine. È un momento estremamente eccitante”. Ed è in questo contesto che si inserisce il lavoro di Baker e colleghi, un lavoro iniziato oltre trent’anni fa, quando gli scienziati iniziarono a sviluppare Rosetta, un software che si occupava della previsione della struttura proteica dividendo il processo in diversi step: i ricercatori provavano a immaginare la struttura di una nuova proteina, spesso mettendo insieme pezzi di altre proteine, e il software cercava di inferire la sequenza di amminoacidi corrispondente a questa struttura. Il problema è che questo processo, oltre a essere molto lungo e dispendioso dal punto di vista computazionale (“Bisognava avere – dice, ancora a NatureSergey Ovchinnov, biologo evoluzionistico alla Harvard University ed ex componente del gruppo di ricerca di Baker – circa 10mila computer in azione contemporaneamente per diverse settimane”), era anche impreciso: le “bozze” create dal software, una volta riprodotte in laboratorio, raramente assumevano la forma desiderata, e si rendeva dunque spesso necessario cambiare ulteriormente la struttura della proteina più volte prima di arrivare al risultato. Un processo di “prova ed errore”, insomma, lungo e complicato.

L’intelligenza artificiale di AlphaFold e simili ha reso questi passaggi praticamente istantanei. Nel nuovo approccio di Baker e colleghi, in particolare, chiamato per l’appunto allucinazione, gli scienziati inseriscono sequenze casuali di amminoacidi in una rete che ne prevede la struttura, alterandola sempre più finché non diventa simile a una proteina “possibile”, a giudizio dello stesso software. Con questo sistema, già lo scorso anno l’équipe di Baker ha creato circa cento proteine “allucinate” in laboratorio, circa un quinto delle quali somigliava molto alla forma prevista. E poi è arrivato il lavoro di oggi, in cui gli scienziati hanno presentato i risultati di un nuovo strumento, ProteinMPNN, che affronta il cosiddetto problema del “ripiegamento inverso”, specificando una sequenza di amminoacidi che corrisponde a una particolare struttura proteica; e anche in questo caso i risultati sono stati estremamente incoraggianti. I gruppi di Baker e di AlphaFold, naturalmente, non sono i soli a lavorare al tema: in una review recentemente pubblicata sul server bioRxiv, Ferruz e colleghi hanno contato oltre quaranta algoritmi di intelligenza artificiale dedicati alla progettazione delle proteine, tutti sviluppati negli ultimi anni.

Per comprendere l’importanza di queste tecnologie è bene ricordare alcuni tra i risultati ottenuti e attesi: lo scorso anno un team di scienziati della University of Oxford, nel Regno Unito, ha usato l’intelligenza artificiale per studiare una proteina che rappresenterebbe uno dei candidati più promettenti per lo sviluppo di un vaccino contro la malaria, cercando in particolare di comprendere in quale punto della struttura si potrebbero legare gli anticorpi più efficaci per bloccare la trasmissione del parassita. Tra gli altri ambiti in cui è stata usata questa tecnologia c’è anche la ricerca di base in biologia, ma non solo: AlphaFold è stata utilizzata anche in alcuni studi sull’inquinamento da plastica, sulla malattia di Parkinson, sulla salute delle api, sulla formazione del ghiaccio, sulle malattie neglette e sull’evoluzione umana.

Fonte: Wired