Blogikirjoitus

Syyt ja seuraukset esiin kausaalimallinnuksella

Kirjoittaja: Ari Rantanen
blog image
By Jukka Reitmaa, Ari Rantanen, Juha Karvanen, Santtu Tikka


Tekoäly on edennyt viime vuosina valtavin harppauksin. Suurimmat edistysaskeleet on otettu koneoppimisen alueella, jossa suuria tietomassoja analysoivat syvät neuroverkot ovat oppineet tunnistamaan tekstiä, puhetta ja kuvia tasolla, joka monissa tapauksissa ylittää ihmisen kyvyt. Tämä kehitys on mahdollistanut esim. luonnollisen kielen ymmärtämiseen ja robottien autonomiseen toimintaan liittyviä sovelluksia, joita aiemmin pidettiin mahdottomina.

Syväoppimisen hienosta edistyksestä huolimatta datatieteilijän saa edelleen hiljennettyä kysymällä häneltä päätöksenteon tueksi näkemystä datasta tunnistettujen yhteyksien, esim. kohonneen myynnin ja erilaisten markkinointitoimenpiteiden, tai potilaiden hoitopolkujen ja terveystilanteen kehittymisen välisistä syy-seuraussuhteista. Ensimmäisenä datatieteilijä muistuttaa, että tilastollisen päättelyn keinoin tuotetut yleistykset perustuvat datassa havaittuihin korrelaatiosuhteisiin, joita ei pidä tulkita kausaalisiksi syy-seuraus -suhteiksi: Pelkkä havainto myynnin ja markkinointibudjetin koon kasvamisesta yhtä aikaa ei välttämättä tarkoita, että tehokas markkinointi on lisännyt myyntiä. Voi myös olla, että kasvanut myynti on mahdollistanut suuremmat panostukset markkinointiin.



Toisena vastauksena syy-seuraussuhteista esitettyyn kysymykseen datatieteilijä tarjoaa kontrolloitua koetta, datatieteilijän kielellä A/B-testiä. A/B-testissä toimenpide, esim. markkinoinnin sähköposti, kohdistetaan toiseen kahdesta mahdollisimman identtisestä kohderyhmästä, toisen ryhmän jäädessä ilman sähköpostia. Sitten tutkitaan, kuinka kohderyhmien välinen ostokäyttäytyminen eroaa sähköpostin lähettämisen jälkeen, ja tulkitaan erojen johtuvan sähköpostista – tai sattumasta.

A/B-testin järjestäminen onkin voimakas työkalu kausaalisuhteiden testaamiseksi ja havaitsemiseksi. Niin voimakas, ettei data- ja tilastotieteilijöiden yhteisö pitkään aikaan muita menetelmiä tunnustanutkaan. Aina A/B-testin järjestäminen ei kuitenkaan ole helppoa, tai edes mahdollista. Ihmisiä ei voi ehdoin tahdoin alistaa myrkyllisille pienhiukkasille, ilmaston puolikasta ei ole mahdollista vapauttaa ylimääräisestä hiilidioksidista, eikä yrityksen asiakkaista ole helppoa rajata kahta samankaltaista kohderyhmää, joista puolet näkevät yleisesti esitettävän TV-mainoksen ja toinen puoli ei.

Eikä tarvitsekaan: tekoälyn seuraava suuri hyppäys, kausaalimallinnus, on valmis siirtymään tutkimuslaboratorioista käytännön sovelluksiin.
 

Kausaalimallinnus kypsä siirtymään laboratorioista käytäntöön

Kausaalimallinnuksen suuri lupaus soveltajille ja asiakkaille on päätöksenteon tuki, joka ei pysähdy mallintamaan menneisyyttä vaan antaa luotettavia vastauksia toimenpiteiden vaikutuksista. Professori Juha Karvanen, yksi alan suomalaisista pioneereista kuvailee kausaalimallinnuksen hyötyjä verrattuna perinteiseen tilastolliseen päättelyyn seuraavasti: “Päätöksenteossa on kyse toimenpiteiden valinnasta. Jotta voisimme tehdä hyviä päätöksiä, meidän tulee arvioida erilaisten toimintavaihtoehtojen odotettuja seurauksia. Tähän tarvitsemme kausaalimallinnusta. Mustina laatikoina näyttäytyvät ennustemallit eivät herätä luottamusta päätöksenteossa -- eivätkä välttämättä anna oikeita vastauksia. Kausaalipäättelyssä oletukset tehdään näkyviksi ja päättelyn kulku oletuksista tuloksiin on toistettavissa ja dokumentoitavissa.”


Tutkijatohtori Santtu Tikka väitteli kausaalimallinnuksesta vuonna 2018. Santtu on kehittänyt ja implementoinut monia kausaalimallinnuksessa tarvittavia algoritmeja. Santun algoritmitoteutuksiin viitataan myös kausaalimallinnuksen suuren yleisön tietoisuuteen tuoneessa Judea Pearlin kirjassa ”The Book of Why” (ilmestynyt myös suomeksi nimellä "Miksi - syyn ja seurauksen tiede"). “Book of Why” onkin hyvä, melko yleistajuinen johdanto kausaalimalleihin.   

Käytännön esimerkkinä kausaalimallinnuksen voimasta Juha ja Santtu nostavat esiin tuoreen tutkimusartikkelinsa, jossa on selvitetty suolan käyttötottumusten kausaalivaikutusta verenpaineeseen. Ainutlaatuista tässä tutkimuksessa on se, että syy-seurausketjun palaset rakennetaan yhdistämällä tietoa kyselytutkimuksesta ja 34 kliinisen kokeen meta-analyysista. Oikeaa tapaa tietojen yhdistämiseen ei tarvitse yrittää keksiä itse, vaan se saadaan suoraan kausaalimallinnuksen tuloksena. Tulosten mukaan korkeasta verenpaineesta kärsivä henkilö voi laskea verenpainettaan keskimäärin kolme yksikköä lopettamalla pöytäsuolan käytön ja suolan lisäämisen ruoanvalmistuksessa.


Kausaalimallinnuksen nykytilanteen Juha ja Santtu kiteyttävät seuraavasti: “Kausaalimallien teoria on nyt edennyt niin pitkälle, että kehitetyt menetelmät voidaan ottaa käyttöön käytännön sovelluksissa. Tätä varten datatieteilijät tarvitsevat uudenlaista ajattelutapaa ja sopivia työvälineitä. Päätöksentekijälle kausaalimallinnus tarkoittaa mahdollisuutta entistä parempiin päätöksiin, jotka perustuvat enemmän tietoon ja vähemmän arvauksiin.” 

Millaisia käytännön ongelmia kausaalimallinnuksen avulla voidaan sitten nykyisin ratkaista? Jukka Reitmaa, kausaalimallinnuksen tuotteistamiseen keskittyvän Explicans-yrityksen perustaja jatkaa: "Kausaalimallinnuksessa ymmärretään, ettei tietämys asu vain datassa, vaan datan ja asiantuntijatiedon tulee toimia yhdessä. Tämä on eduksi monimutkaisissa päätöksentekotilanteissa joissa tarvitaan useita eriluonteisia tietolähteitä: kokemuksellista tietoa, parhaita asiantuntija-arvioita, kerättyä dataa. Runsaimmin kausaalimallinnusta on hyödynnetty lääketieteellisessä tutkimuksessa, koska siellä vaikuttavuus on keskiössä. Myös investointipäätökset, liiketoimintaprosessien suunnittelu tai vaikkapa markkinointiviestinnän optimointi ovat pohjimmiltaan syy-seurausongelmia ja ratkeavat toden teolla vasta kausaalimallinnuksen avulla.



“Ilman kausaalimallinnusta tämän tyyppisten ongelmien ratkaisu jää väistämättä mutupohjaiseksi ja voi pahimmassa tapauksessa johtaa vääriin toimenpiteisiin”, Jukka Reitmaa toteaa. ”Explicansin kehittämä teknologia mahdollistaa käytännön syy-seurausongelmien analysoinnin ja luotettavien vastausten löytämisen.”
 

Pilotit käynnistyvät

AI Roots ja Explicans kartoittavat parhaillaan sopivia pilottikohteita Explicansin kausaalimallinnusmenetelmien ja -prosessin validoimiseksi liiketoimintakumppaneiden kanssa. Asiakkailta saatu vastaanotto on tähän mennessä ollut erittäin innostunutta. “Datalähtöisen päätöksenteon tuen tyypillinen haaste on asiantuntijoiden ja päättäjien hiljaisen tiedon systemaattinen yhdistäminen yrityksen keräämien tietomassojen sisältämään informaatioon. Mahdollisuus validoida datalla päivittäistä päätöksentekoa ohjaavan hiljaisen tiedon sisältäviä oletuksia kriittisten prosessien syy-seuraussuhteista ymmärrettävästi kiinnostaa yrityksiä ja organisaatioita yli toimialarajojen. Aidot vastaukset kysymyksiin ‘Miksi havaitsemamme ilmiö tapahtui?’ sekä ‘Mitä tapahtuu, jos menettelemme jatkossa toisin’ ovat datalähtöisen päätöksenteon tavoitteita, joiden saavuttamiseksi kausaalimallinnus tarjoaa työkaluja, jotka tulevat uudistamaan datalähtöisen päätöksenteon kentän”, toteaa Ari Rantanen, yksi AI Rootsin perustajista.



“Esim. monikanavaisen markkinoinnin kenttään kausaalimallinnus tarjoaa kauan kaivattuja työkaluja yleiseen tilanteeseen, jossa kampanja sisältää eri kanavissa tapahtuvia kohdennettuja ja kohdentamattomia toimenpiteitä, jotka tähtäävät mahdollisesti viivellä tapahtuvaan konversioon. Asiakaskokemuksen johtamiseen kausaalimallinnus tarjoaa samoin työkaluja, esim. tuotteen ominaisuuksien ja hinnan muutosten vaikutuksen aiempaa selkeästi realistisempaan arviointiin. Myös tuoteportfolion optimointi, valmistavan teollisuuden prosessien harvinaisten tapahtumien mallinnus tai vaikkapa työntekijöiden urapolun ymmärtäminen ovat käytännön ongelmia, jotka hyötyvät kausaalimallinnuksesta.”

”Hyötyäkseen kausaalimallinnuksesta yritys tarvitsee vain tunnistetun, syy-seuraussuhteiden ymmärtämistä vaativan liiketoimintaongelman, näkemyksen liiketoimintaprosessin kausaalisuhteista sekä dataa prosessin eri vaiheista”, Jukka Reitmaa sanoo ja jatkaa: ”Kannattaa ottaa rohkeasti yhteyttä, kykenemme nopeasti arvioimaan kuinka kausaalimallinnus kykenee auttamaan liiketoimintaongelmasi ratkaisemisessa.” Epäreilua kilpailuetua uuden teknologian varhaisille soveltajille jaetaan nyt.

Kiinnostuitko kuulemaan lisää? 

Herättikö kirjoitus ajatuksia? Jutellaan!

Talent agent profile picture

Ari Rantanen

Perustaja

+358 50 4830871

ari@rootsof.ai