data

Data Governance 3.0.

Data Governance has been a heating but troublesome topic for years when companies have tried to navigate in their digital and data-driven company journey. It has started to become evident that traditional human process -driven ways will not scale when the amount, velocity and criticality of data increases. In this article I go through what are the most important factors to consider in a modern and scalable third wave of Data Governance. The article is in Finnish, but if the topic is interesting, feel free to leave your contact details at the end of the article and let's continue the discussion in English.

 

Uuden ajan Data Governance 3.0 koskettaa kaikkia

Data governance ei terminä välttämättä nosta sykettä positiivisessa mielessä, mutta oikeasti aihe on kuuma kuin uunituore peruna. Lisäksi se koskee ihan jokaista työntekijää yrityksessä. Voidaankin puhua data governancen uudesta tulemisesta tai data governance 3.0:sta.

Käyn läpi alussa lyhyesti mistä on kyse ja miten ala on kehittynyt viime vuosien aikaka. Voit myös hypätä suoraan kohtaan Data Governance 3.0, jossa käydään läpi tarkemmin, millä toimenpiteillä rakennetaan todellinen tulevaisuuden data-vetoinen organisaatio.

 

Data governance

Data governancella eli datan hallintamallilla on monta erilaista määritelmää, mutta selkeyden vuoksi tässä yhteydessä määritellään sen olevan:

Yrityksen strategisen tiedon hallinnan ja johtamisen kehikko, jossa huomioidaan mm. ihmiset, prosessit ja teknologiat. Tavoitteena on varmistaa laadukkaan ja ajantasaisen tiedon saanti liiketoiminnan tekemistä varten.

Käytännössä data governance on historiansa aikana kärsinyt hyvin monenlaisista ongelmista, kuten:

  • Yrityksen kulttuurin kehittäminen on jäänyt huomioimatta. Se, että yhtäällä rakennetaan prosesseja ja malleja ei tarkoita, että toisaalla ne otetaan käyttöön edes pakolla. Ihminen on datan laadun heikoin lenkki.
  • Governance koetaan ylimääräisenä ärsyttävänä prosessina, joka aiheuttaa turhaa lisätyötä. Sen arvoa omaan työhön ei ymmärretä.
  • Data on hajallaan eri puolilla yritystä erilaisissa järjestelmissä ja sen yhdistäminen on työlästä ja hidasta. Etenkin, kun yhteistyö liiketoimintasiilojen välillä on vähäistä.
  • Työkalut ovat olleet puutteellisia. Excelistä on moneen, mutta ehkä sillä ei kuitenkaan saada koko yrityksen tietovarantoa haltuun.
  • Tiedon omistajuus ja vastuut on puutteellisesti määritetty eikä ihmisillä ole tapana napata töitä oman vastuualueensa ulkopuolelta. Moni datahaaste tippuukin vastuiden väliin.
  • Koko aihealue on usein aliresursoitu, eikä riittävän korkealla johdon prioriteeteissa

Picture from Unsplash by Daniel Mccullough

 

Vanhalla manuaalisella prosessitavalla ajatella data governancea ei pitkälle päästä. Tarvitaan siis uusi lähestymistapa. Data Governance 3.0.

Hetkinen, mihin jäi välistä data governance 2.0? Pikaisesti kuvattuna toisen vaiheen data governancessa on jo ratkottu monia alkuvaiheen ongelmia, kuten:

  • Data koetaan yhteisenä koko organisaatiolle. Siiloajattelua ei ole.
  • Työkalut ovat kehittyneempiä, esim. Data Catalog -välineet ja kevyet automaatioratkaisut
  • Governance-prosessit ovat joustavampia, hyödyllisempiä ja ne koetaan yhteisiksi.

Näillä päästään jo 2020-luvulle, mutta tulevaisuudessa datan hallinnassa on edessä vielä isommat haasteet, jotka vaativat vielä järeämpiä otteita:

  1. Datan määrä kasvaa nousevaa vauhtia ja sen hallinta perinteisin keinoin vaikeutuu
  2. Datan sijaintien määrä monipuolistuu. Dataa tulee ovista ja ikkunoista, etenkin kun IoT-ratkaisut laajenevat.
  3. Datan ajantasaisuustarpeet ovat kasvaneet.
  4. Data on demokratisoitunutta, eli kuka tahansa yrityksestä voi käyttää mitä tahansa dataa
  5. Regulaatiot edellyttävät yhä vaativampia hallintaratkaisuja.
  6. Tekoälyn ja edistyneen analytiikan konvertointi liiketoiminnaksi edellyttää datalta ihan uusia vaatimuksia.

Picture from Unsplash by Ivan Bandura

 

 

Data Governance 3.0

Miltä näyttää data governance, joka skaalautuu ei vain 2020-luvulla, vaan myös tulevina vuosina ja vuosikymmenenä?'

 

Data governance on ylimmän johdon strateginen prioriteetti

Yrityksen täytyy ymmärtää datan olevan heille strateginen assetti. Jos näin ei ole, on turha lähteä kovin kunnianhimoisiin data-hankkeisiin, kuten tekoälypohjaiseen liiketoimintaan.

Usein yritykset, joilla tämä on kunnossa, johtoryhmässä istuu esim. Chief Data Officer tai Chief Analytics Officer tai toimitusjohtajakin viittaa puheessaan usein dataan ja sen arvoon.

Picture from Unsplash by Josh Olalde

 

 

liiketoimintavetoinen ja keskitetty

Uuden ajan data governancen pääkehittämisvastuu on liiketoiminnoilla. Liiketoiminnat ovat lähellä asiakasta ja tietävät parhaiten miten datan arvoa pitää jalostaa. Näin vältytään perinteisiltä tuottamattomilta keskusjohtoisilta mammuttiprojekteilta, joiden hyötyä yritetään turhaan jälkikäteen perustella liiketoiminnoille.

Liiketoimintavetoisuuden lisäksi tarvitaan tueksi vahva keskitetty data governance -tukipalvelu. Ilman tätä ei päästä hyödyntämään koko organisaation voimavaroja data-arvon tuottamisessa, jolloin datat jää siiloihin tai teknologiset ratkaisut jää puolitiehen. Digitaalisuus ja datavetoisuus on kuitenkin isojen toimijoiden hommaa eikä homma onnistu siiloissa. Mitä enemmän dataa ja resursseja sen hyödyntämiseen, sitä enemmän arvoa siitä voidaan luoda.

Miten yhdistetään liiketoimintavetoisuus ja keskitetty tuki? Tähän on monia erilaisia hyväksi havaittuja malleja, jotka pohjautuvat kokemuksiin siitä, miten ylipäätään rakennetaan ketteriä asiakaslähtöisiä ison skaalan teknologiayrityksiä. Mutta aihe on liian laaja avattavaksi tässä.

Picture from Unsplash by James Sullivan

 

 

DataOps ja Data Platform

Tulevaisuudessa data governancessa edellytetään lähes poikkeuksetta teknologisia ratkaisuja datan virtauksen ja laadun tukemiseen. Tiedämme jo nyt, että ihmisten prosessiohjaus tietotyössä ei skaalaudu, koska ihmiset eivät ole koneita vaan epärationaalisia ja tunneohjautuvia otuksia. Kaikki, jotka ovat yrittäneet jalkauttaa prosesseja laajoihin organisaatioihin ovat havainneet tämän. Koneet taas ovat loistavia toistuvissa prosesseissa.

Aikoinaan ohjelmistokehityksessä ryhdyttiin hakemaan ketteryyttä, tehokkuutta ja laatua siirtymällä julkaisuautomaatioon devops-menetelmien tukemana. Datakehityksessä taas siirrytään virtausautomaatioon dataops-menetelmillä.

Automaatiolla ja teknologian avulla voidaan saavuttaa mm. seuraavia asioita:

  • Varmistetaan tiedon laatu kaikissa kriittisissä kohdissa.
  • Korjataan virheitä ja nostetaan esiin ongelmia ratkaisuehdotuksineen.
  • Sanitoidaan dataa määräysten ja tietoturvavaatimusten mukaiseksi.
  • Jalostetaan helpommin hyödynnettäväksi.
  • Varmistetaan reaaliaikaisen tiedon saanti.
  • Seurataan ja mitataan datan laatua ja käyttöä.

Pelkkä datan virtauksen optimointi ei kuitenkaan riitä, vaan data-arvon jakamiseksi organisaation käyttöön tarvitaan data-alusta (Data Platform), jonka pohjalle data-vetoista liiketoimintaa voi tehokkaammin rakentaa. Data-alusta tarjoaa perinteisemmän data katalogin (Data Catalog) lisäksi hallitun ja helppokäyttöisen pääsyn itse dataan. Data-alustan voi kuvata tarjoavan yritykselle dataa palveluna. Tämä voi tarkoittaa esim. itsepalvelu-API-ratkaisuja tai tuotteistettuja pääsyratkaisuja tietovarastoihin (Data Warehouse) tai tietoaltaisiin (Data Lake).

Picture from Unsplash by Chirsopher Burns

 
mikä on ihmisen rooli?

Kun aiemmin data governancea lähestyttiin ihmisten manuaalisten prosessien kautta, niin onko ihminen nyt merkityksetön, kun kaikki pyörii teknologisten ratkaisujen päällä? Ei, päinvastoin. Ihmisen merkitys vaan korostuu entisestään. 

  1. Ensinnäkin teknologiaratkaisujen kehittäminen tapahtuu hyvien ihmisten hyvän yhteistyön kautta. Eikä tarvitse murehtia, että työt loppuvat kun homma on valmis, koska yrityksen strategisimman varannon ympärillä on kehitettävää niin kauan kuin yritys on olemassa.
  2. Toiseksi, koneet eivät ymmärrä datan arvoa eivätkä osaa empatisoida mitä asiakas arvottaa. Ihmisiä tarvitaan jatkossa yhä enemmän tulkitsemaan mitä data oikeasti tarkoittaa ja miten se konvertoituu asiakkaan koetuksi arvoksi.
  3. Kolmanneksi, algoritmien monimutkaistuessa ja etenkin itseoppivien algoritmien ohella tarvitaan ihmistä, joka pystyy selittämään miten johonkin tiettyyn päätökseen päädyttiin. Emme varmaankaan halua antaa täyttä valtaa koneille koskaan.

Eli, jos aiemmin data governancessa pääfokus oli prosesseissa ja tuskailtiin teknologian ja ihmisten kanssa, uuden ajan data governancessa mukaan tulee yhtä vahvasti sekä teknologia että ihminen.

 

Picture from Unsplash by Umit Yildirim

 

Miksi siis data governance on niin tärkeää kaikille?

Ihmisprosesseihin perustuvassa yrityksessä tieto liikkuu aina melko hitaasti ja sen laatu on heikkoa. Tämä on mahdollistanut luonnollisten tietosiilojen syntymisen, mikä taas on rajoittanut tiedon jalostumista ja siten yrityksen kehittymistä.

Digitalisoituvassa maailmassa ihmisvetoinen hidas tietojen käsittely jää nopeasti jalkoihin. Data liikkuu alle sekunnissa maailman ympäri, yhdistyy muuhun dataan ja jalostuu kehittyneiden algoritmien toimesta lisäarvoksi suoraan asiakkaalle. Tällaisessa maailmassa pärjäävät ne yritykset, joissa data on osana niiden DNA:ta. Näissä yrityksissä jokainen ymmärtää miten data vaikuttaa asiakasarvoon ja pyrkii tekemään osansa tämän arvon maksimoimiseksi.

Data governance ei ole enää mikään irrallinen hanke, vaan koko yrityksen kattava yhteinen datan strategisen ja operatiivisen johtamisen malli, joka on rakennettu meidän toimesta meidän käyttöön. Sen tarkoituksena on varmistaa, että pystymme hyödyntämään teknologian tuomat mahdollisuudet ja rakentamaan yhä parempia palveluja asiakkaillemme yhä tehokkaammin.

 

Picture from Unsplash by Danist