La URV crea una IA que genera milions de molècules noves

per: Redacció

L’eina, publicada a Nature Machine Intelligence, pot dissenyar compostos químics vàlids per avançar en fàrmacs i materials

Un equip investigador de la Universitat Rovira i Virgili (URV) ha desenvolupat una eina d’intel·ligència artificial capaç de generar milions de molècules noves que compleixen les lleis de la química i que, per tant, podrien existir a la realitat. Els resultats de la recerca s’han publicat a la revista Nature Machine Intelligence.

El sistema, anomenat CoCoGraph, funciona de manera similar a les eines d’IA generativa de text o imatges, com ChatGPT o DALL·E. “Aquests models creen contingut nou que s’assembla molt al real. El nostre algoritme fa el mateix, però amb molècules”, explica Roger Guimerà, professor de recerca ICREA del Departament d’Enginyeria Química de la URV.

La recerca de noves molècules és un dels grans reptes de la química moderna. Des del desenvolupament de fàrmacs fins a la creació de materials més sostenibles, trobar combinacions d’àtoms amb propietats útils resulta fonamental. L’espai de molècules possibles és immens: s’estima que podria haver-hi fins a 10⁶⁰ molècules diferents, una xifra molt superior a les molècules d’aigua que conté l’oceà. Les molècules conegudes, però, només en representen una part ínfima.

Com funciona CoCoGraph

El model utilitza una tècnica anomenada model de difusió, habitual en la generació d’imatges. El procés consisteix a desordenar progressivament una molècula real i entrenar el sistema perquè aprengui a reconstruir-la. “Partim d’una molècula real, trenquem els enllaços i en creem de nous de manera aleatòria. El model aprèn a revertir aquest procés i reconstruir estructures coherents”, explica Marta Sales-Pardo, investigadora del mateix departament.

Una de les principals innovacions del model és que incorpora directament les regles bàsiques de la química: cada àtom manté sempre el nombre correcte d’enllaços. Això garanteix que el 100% de les molècules generades siguin químicament vàlides, a diferència d’altres models que poden produir estructures impossibles. A més, el sistema és més eficient: utilitza menys paràmetres i necessita menys potència de càlcul.

L’equip ha comparat CoCoGraph amb altres models d’última generació i ha analitzat fins a 36 propietats fisicoquímiques de les molècules generades. El resultat mostra que els compostos creats són químicament més realistes en aproximadament dues terceres parts d’aquestes propietats.

Molècules que enganyen els experts

Per comprovar la qualitat dels resultats, l’equip va fer un experiment amb 121 experts en química de la mateixa universitat. Cada participant veia vint parelles de molècules —una de real i una de generada per la IA— i havia d’identificar quina era la real. Els experts es van equivocar en aproximadament 4 de cada 10 casos. “Això vol dir que moltes de les molècules que generem són molt convincents”, destaca Sales-Pardo.

Tot i que el model encara no permet dissenyar molècules amb una funció concreta, ja se n’han fet proves prometedores. Per exemple, s’han identificat compostos amb propietats similars al paracetamol dins dels milions de molècules generades. L’objectiu a mitjà i llarg termini és poder demanar a la IA una molècula amb propietats específiques: que sigui soluble, no tòxica i útil per a una aplicació determinada. “De moment només generem molècules. El pas següent serà poder guiar aquesta generació amb objectius concrets”, apunta Manuel Botella, estudiant de doctorat participant en la recerca.

Si s’aconsegueix, aquesta tecnologia podria transformar camps com la farmacologia o la ciència de materials i accelerar el descobriment de noves solucions.

RELACIONATS