Helsingin Yliopiston ja Orionin tutkimushankkeessa yhdistetään kemian uusimpia menetelmiä ja koneoppimista eli tekoälyä uusien lääkeaineiden tutkimuksessa. ”Tavoitteena on optimoida lääkekehitystä siten, että uusia tehokkaita ja turvallisia lääkeaineita saataisiin jatkossa nopeammin potilaille”, kertoo Discovery Data Technology Lead Julius Sipilä Orionin tutkimuksesta.
Tutkimuksessa pyritään optimoimaan lääkesynteesejä ja tunnistamaan tehokkaampia tapoja valmistaa uusia lääkeaineita. Samalla tavoitteena on pohjustaa uudenlaista koulutusta tulevaisuuden kemisteille, jotta he osaisivat paremmin yhdistää koneoppimisen ja synteesiteknologian uusia menetelmiä.
Laskentateho tuo nopeutta ja tarkkuutta
Tekoäly tuodaan kemistien tueksi, koska tehtävä on monitahoinen ja vaativa. ”Kun kehitämme uusia lääkeaineita, joudumme ensimmäisinä maailmassa syntetisoimaan tiettyä yhdistettä. Ensinnäkin pitää suunnitella synteesireitti. Se koostuu monesta reaktiosta, joista jokainen pitää saada onnistumaan. Jokaiseen reaktioon pitää valita lähtöaineet, reagenssit, katalyytit, liuottimet, lämpötilat ja tilavuudet. Muuttujia on paljon ja joka reaktiossa miljoonia vaihtoehtoja”, Sipilä kuvaa.
Yliopiston kanssa tehtävässä tutkimuksessa hyödynnetään koko sitä reaktiodataa, joka on kertynyt aiemmissa projekteissa. ”Yritämme hyödyntää sekä omista projekteistamme kertynyttä että julkisesti saatavilla olevista reaktiotietokannoista löytyvää dataa mahdollisimman hyvin, ja pureskella sitä koneoppimisen hyödynnettävissä olevaan muotoon. Sitä sitten käytämme auttamaan kokeellista kemiaa.”
Sipilä toteaa, että optimointia voidaan tehdä vasta sitten, kun on saatu reaktiot ensimmäisen kerran jotenkin onnistumaan ja saatu uusi aine ensimmäisiin testeihin. Kun uuden lääkeaineen toimivuutta aletaan testata, aineen määrällinen tarve kasvaa nopeasti.
”Ainetarve kasvaa nopeasti tuhansia kertoja, ja silloin synteesireittiä pitää tosissaan lähteä optimoimaan. Tähän tulee avuksi koneoppiminen. Ensimmäisistä reaktioista saadaan dataa ja nähdään, mikä toimii ja kuinka hyvin. Sitten kone ehdottaa, mikä optimointikokeilu olisi järkevää tehdä seuraavaksi. Verrattuna siihen, että kemistit tekevät työtä ilman tällaista työkalua, tekoälyä hyödyntämällä päästään nopeammin riittävän hyvin toimiviin reaktioihin.”
Vaikutuksia Orionin tutkimuksiin laajemminkin
Tämä tutkimus on osa isompaa kokonaisuutta, sillä uusien koneoppimiseen pohjautuvien menetelmien hyödyntäminen on oleellinen osa nykyaikaista lääketutkimusta sen joka vaiheessa – tautimekanismien selvittelystä kliinisiin kokeisiin asti. Orionin tutkimuksessa on viime vuosina käynnistetty useita projekteja, joissa hyödynnetään omaa ja julkista dataa koneoppimisen avulla. Monia hankkeita on käynnistetty yliopistojen ja eri yrityskumppaneiden kanssa.
”Koneoppimisen hyödyntämisessä tarvitaan monenlaista kehitystyötä, jonka myötä voimme esimerkiksi tarjota opinnäytetyön tekijöille mielenkiintoisia projekteja”, Sipilä sanoo.
Sipilä näkee hankkeen hyvänä esimerkkinä siitä, minkälaisia tutkijoita tulevaisuudessa tarvitaan. ”Kemistien pitää osata hyödyntää erilaisia menetelmiä ja tämä vaatii uudenlaisia ajattelumalleja.”
Lääketieteen kannalta hyödyt ovat selkeät. ”Uusien lääkkeiden kehityksen nopeus on tärkeää potilaille. Lisäksi reaktioiden optimointi vähentää erehdyksiä ja hukkaa. Näin voimme vähentää myös ympäristövaikutuksia”, Sipilä sanoo.