I nuovi Nobel della chimica hanno a che fare con le proteine. Che si possono progettare ex novo con una forma utile per combattere le malattie
Quando pensiamo all'AI, l'intelligenza artificiale, pensiamo a uno strumento tra lo stupido e il diabolico. Abbiamo in mente alcune delle cose che sa fare, e queste ci stanno antipatiche o addirittura ci fanno paura: per esempio i testi insipidi che l'AI sforna sostituendosi agli scrittori, o i video falsi che l'AI genera, talvolta utilizzati per costruire fake news.
Sono tutti output che hanno bisogno di istruzioni: «mostrami Kamala Harris e Donald Trump che passeggiano tenendosi per mano e poi si baciano». È un video che ancora gira in rete, ma per generarlo l'AI ha dovuto prima imparare. E cioè digerire video (veri) di Trump e Harris, nonché apprendere il concetto di passeggiata e di bacio. I premi Nobel per la fisica e per la chimica, assegnati martedì 8 e mercoledì 9 ottobre, hanno molto a che fare con questo. Ma ci suggeriscono che all'AI possiamo guardare anche con rispetto, se non gratitudine.
Bisogna partire dalle proteine. Sono fatte di aminoacidi come alanina, leucina, cisteina (ce ne sono venti), piccole molecole considerate i mattoni della vita. Le proteine sono costituite da lunghe catene di aminoacidi, fino a qualche migliaio. Caratteristica fondamentale delle proteine è la struttura, cioè forma, perché ne determina la funzione. Funzione che può andare dal costituire il tessuto muscolare al degradare molecole tossiche, o al trasportare ioni ferro nel sangue. Ma da cosa deriva la forma di una proteina? Da come le sue catene di aminoacidi si ripiegano e si avvolgono, cosa che a sua volta dipende da come gli aminoacidi di certe parti della catena interagiscono con gli aminoacidi di altre parti della catena. Ma se conosciamo la sequenza degli aminoacidi di una proteina, cioè come questi sono allineati lungo la catena, dovremmo essere in grado anche di sapere come questi interagiscono tra loro e, dunque, di prevedere la forma che avrà la proteina. Giusto? Fino a sei anni fa assolutamente no.
Ci sono tecniche sperimentali che ci permettono di conoscere la struttura di una determinata proteina: la si isola, purifica, cristallizza, si conduce un esperimento di diffrazione di raggi X sul cristallo, e, dopo tanti calcoli, ecco la struttura. È una faticaccia, ma lo si fa dagli anni 50.
A loro volta le proteine possono essere sequenziate, cioè in laboratorio può essere determinata la loro composizione quanto ad aminoacidi, e sapere come questi sono messi in fila lungo la catena. Ebbene, sul rapporto sequenza/struttura nel 1994 è stata aperta una competizione pubblica biennale tra i biochimici, la CASP (Critical Assessment of Protein Structure Prediction). Chi vi partecipava aveva accesso alle sequenze di aminoacidi di nuove proteine di cui era anche appena stata determinata la struttura per diffrazione su cristallo. Quest'ultima, la struttura, non era però resa nota ai partecipanti. Si doveva appunto prevederla sulla sola base della sequenza aminoacidica. Risultato? Solo fallimenti. Non è sorprendente: dopotutto anche una proteina fatta di appena 100 aminoacidi ha 10 elevato alla 47 (e cioè più di un miliardo di miliardi di miliardi di miliardi di miliardi) potenziali strutture tridimensionali. Le cose sono cambiate radicalmente nel 2018 quando Demis Hassabis ha partecipato alla CASP. Hassabis è uno dei tre premiati con il Nobel per la chimica di quest'anno, e non è un chimico. Laureato in computer science e con un dottorato in neuroscienze, ora CEO di GoogleDeepMind, nel suo esordio nella competizione CASP è riuscito a centrare le previsioni delle strutture delle proteine al 60% usando l'AI.
Un suo sistema, AlphaFold, era stato istruito con tutte le strutture di proteine note sin lì, e con le corrispondenti sequenze di aminoacidi. John Jumper invece ha una laurea in fisica teorica della materia e un dottorato in chimica teorica. Esperto di proteine, è entrato in GoogleDeepMind nel 2017, ha iniziato subito a lavorare con Hassabis, e ha portato nell'approccio AI i concetti delle reti neurali per modellizzare le proteine, migliorando AlphaFold in una nuova versione. Nel 2020 lui e Hassabis usando AlphaFold2 hanno centrato pressoché al 100% i quesiti della competizione CASP, tanto che da allora tutti i partecipanti lo usano (è stato reso open source).
Quest'anno Jumper ha ottenuto metà del Nobel per la Chimica, divisa a sua volta con il collega Hassabis. E il Nobel per la Chimica ha seguito di un solo giorno quello per la Fisica, assegnato a John Hopfield e Geoffrey Hinton, per lo sviluppo della tecnologia delle reti neurali nel machine learning, cioè quel processo che attraverso l'apprendimento da parte di un computer di schemi noti, e con il confronto tra quelli noti e quelli proposti, può portare, per dire una cosa semplice, al riconoscimento di una persona o di un oggetto in una foto. O, per dirne una più complicata, alla previsione della struttura reale di una proteina.
Manca il terzo vincitore del Nobel per la Chimica 2024, quello che se n'è aggiudicato l'altra metà. È David Baker, questa volta un biochimico a tutti gli effetti, del genere che usa l'approccio in silico (cioè al computer), ma che poi le molecole le sintetizza davvero. Baker ha elaborato un programma che ha chiamato Rosetta (come la stele), che fa il lavoro opposto di quello di Hassabis e Jumper: nota la struttura di una proteina, ne trova la sequenza di aminoacidi. Rosetta si basa sull'esplorazione dei database delle strutture delle proteine e delle corrispondenti sequenze, e cerca piccoli frammenti di sequenze aminoacidiche che abbiano una struttura simile a frammenti di quella desiderata. Un lavoro da AI. E infatti nel 2020 Baker ha implementato in Rosetta un sistema simile ad AlphaFold2, migliorandone notevolmente l'uso.
L'approccio di Baker ha un importante vantaggio: se ti inventi una proteina con una data struttura, con Rosetta puoi capire con quale sequenza di aminoacidi la puoi ottenere, e poi prepararla in laboratorio. Se già questi imponenti risultati scientifici ci fanno provare rispetto, è qui che arriva anche la gratitudine.
Perché si possono progettare ex novo proteine con una forma che gli permette di svolgere funzioni utili, determinarne la sequenza aminoacidica, e poi sintetizzarle davvero: proteine utili come vettori per la somministrazione più efficace di farmaci, sensori selettivi per molecole specifiche (come per esempio il fentanyl, la cosiddetta «droga degli zombie»), o proteine che imitano la struttura dei virus dell'influenza, che possono essere usate come vaccini.
*Professore ordinario di chimica inorganica all'Università di Pavia