L’intelligenza artificiale ha imparato a fare la retrosintesi da sola

L’intelligenza artificiale ha imparato a fare la retrosintesi da sola

Un gruppo di scienziati ha elaborato un sistema informatico basato sulle reti neurali che è in grado di progettare le reazioni di sintesi chimica in più fasi. Uno strumento che potrebbe aiutare a creare nuove molecole in minor tempo e a minor costo

Partire dalla fine per risalire passo dopo passo, reazione dopo reazione, al composto chimico di partenza. A dirla così, la teoria alla base della retrosintesi non parrebbe complicata. Tuttavia le possibili trasformazioni a ogni step retrosintetico possono essere centinaia, se non migliaia. E richiedere ore o anche giorni di pianificazione, più un pizzico di intuito da parte dei chimici organici. E qui la questione si complica eccome. Tanto da mettere in crisi persino i sistemi di intelligenza artificiale utilizzati finora. Ma un nuovo studio, pubblicato su Nature da Marwin Segler, ricercatore dell’Università di Münster in Germania, e dai suoi colleghi, ha mostrato come utilizzare le reti neurali basate sul deep-learning (l’apprendimento di dati, non forniti dall’essere umano, grazie all’utilizzo di algoritmi di calcolo statistico) per individuare potenziali vie di reazione, in maniera simile a come farebbe un vero chimico organico.

Credits: © Svensk Reportagetjänst 1990

Il concetto di retrosintesi è stato introdotto da Elias James Corey negli anni ’60. Considerato da molti uno dei più grandi chimici viventi, Corey è stato insignito del premio Nobel per la chimica nel 1990 “per lo sviluppo della teoria e della metodologia della sintesi organica”. L’obiettivo dell’analisi retrosintetica è sì tornare a composti di partenza facilmente disponibili, ma tenendo conto di alcuni fattori caratteristici di una buona sintesi: il minor numero di passaggi coinvolti, il costo dei reagenti impiegati, il minor impatto ambientale e la massima resa dei prodotti di questi passaggi. Chimici e programmatori lavorano da 60 anni all’idea di utilizzare la potenza di calcolo del computer per progettare reazioni di retrosintesi, ma senza notevoli risultati. I programmi creati finora utilizzano enormi database di reazioni chimiche, che non solo generano difficoltà nella gestione dell’hardware e richiedono l’aggiornamento manuale continuo dei dati, ma non sono neanche sufficienti a descrivere il comportamento delle varie specie chimiche in tutte le possibili condizioni di reazione.

L’approccio utilizzato da Segler e colleghi è stato diverso: progettare un programma capace di apprendere da solo, anziché inserire liste infinite di dati. A tale scopo hanno combinato tre reti neurali artificiali con il metodo di ricerca ad albero Monte Carlo, un algoritmo di ricerca casuale utilizzato nei processi decisionali per evidenziare i percorsi più promettenti. Le regole per l’addestramento delle reti neurali sono state estratte da tutte le reazioni pubblicate nella storia della chimica organica: 12,4 milioni. “Le reti neurali profonde sono utilizzate per prevedere quali reazioni sono possibili con una certa molecola”, ha spiegato Mike Preuss, co-autore dello studio. “Usando il metodo Monte Carlo, il computer può verificare se le reazioni previste portano realmente alla molecola bersaglio”. Il nuovo metodo è circa 30 volte più veloce dei programmi convenzionali per la pianificazione delle sintesi e trova potenziali vie per il doppio delle molecole.

E non solo migliora la quantità delle previsioni, ma anche la qualità. I ricercatori hanno condotto un test in doppio cieco per valutare l’affidabilità dei progetti di retrosintesi ottenuti con il nuovo sistema. Infatti, un limite nelle pianificazioni di sintesi finora ottenute con i computer era che i passaggi proposti non sempre erano plausibili, scoraggiando gli scienziati dal fare pieno affidamento su queste previsioni. Hanno quindi chiesto a un gruppo di chimici organici di valutare sia i percorsi sintetici generati dalla macchina che quelli riportati in letteratura, scegliendo nove molecole target. I risultati del test non hanno mostrato preferenze significative per una delle due vie proposte: la retrosintesi dell’intelligenza artificiale funzionava tanto bene quanto quella dei chimici veri.

Il sistema di pianificazione dell’analisi retrosintetica con le reti neurali profonde ha già richiamato l’attenzione di diverse case farmaceutiche, in quanto potrebbe semplificare e accelerare la ricerca di nuovi farmaci. Ma gli stessi autori dello studio mettono in guardia dal considerare il metodo privo di pecche. Le sfide rimangono, come la sintesi dei prodotti naturali o la previsione dei risultati stereochimici, non ancora alla portata dell’intelligenza artificiale. “Il nuovo strumento sarà un assistente per il chimico che vuole creare molecole il più rapidamente possibile”, ha concluso Segler, “ma il dispositivo di navigazione GPS può rendere ridondanti le mappe cartacee, non il conducente dell’auto”. I chimici organici possono stare tranquilli, c’è ancora posto per loro in laboratorio.

Immagine in evidenza: Credits Creative Commons