Data Governance

Kirjoittanut Samu Lahdenperä · Julkaistu 1.6.2026

Data governance tarkoittaa organisaation datan hallintaan liittyvien päätösten, vastuiden, prosessien ja standardien kokonaisuutta. Hyvä data governance varmistaa, että data on luotettavaa, saatavilla oikeille ihmisille ja käytetään laillisesti ja tarkoituksenmukaisesti. Se ei ole pelkästään tekninen ratkaisu, vaan ennen kaikkea organisatorinen ja kulttuurinen muutos.

Lyhyesti: Data governance vastaa kysymyksiin kuka omistaa datan, kuka saa käyttää sitä, miten sen laatu varmistetaan ja miten sen elinkaarta hallinnoidaan.

Mitä data governance käytännössä tarkoittaa?

Data governance kattaa koko organisaation dataan liittyvät pelisäännöt. Siihen kuuluu datan omistajuuden määrittely, laadun valvonta, metadatan ylläpito, pääsynhallinta sekä tietosuoja- ja lakisäädösten noudattaminen. Ilman selkeää hallintamallia organisaatioissa syntyy helposti tilanne, jossa kukaan ei tiedä mistä data tulee, kuka siitä vastaa tai onko se luotettavaa.

Käytännön tasolla data governance näkyy esimerkiksi siinä, että jokaisella tietoaineistolla on nimetty omistaja, datan laatu tarkistetaan säännöllisesti, ja käyttöoikeuksista päätetään selkeän prosessin mukaan.

Dataneuvoksen mielipide

Aloita pienestä mutta dokumentoi heti alusta. Monessa organisaatiossa data governance -hanke kaatuu liialliseen monimutkaisuuteen ensiaskeleilla. Valitse kolme tärkeintä tietoaineistoa — esimerkiksi asiakkaat, tuotteet ja myynti — ja määrittele niille omistajat sekä laatukriteerit. Kun nämä toimivat, laajenna mallia askel kerrallaan.

Kuka omistaa datan organisaatiossa?

Datan omistajuus on yksi data governancen keskeisimmistä kysymyksistä. Omistajuus ei tarkoita teknistä hallintaa, vaan vastuuta siitä, että data on oikeaa, ajantasaista ja käyttökelpoista. Tyypillinen roolitus on seuraava:

Rooli Vastuu Esimerkki
Data Owner (datan omistaja) Liiketoimintavastuu datan sisällöstä ja laadusta Myyntijohtaja vastaa myyntidatasta
Data Steward (datan hoitaja) Päivittäinen datan laadun valvonta ja dokumentointi Controller ylläpitää asiakasrekisterin laatusääntöjä
Data Custodian (datan säilyttäjä) Tekninen vastuu tallennuksesta, varmuuskopioinnista ja tietoturvasta IT-arkkitehti hallinnoi tietovaraston infrastruktuuria
Data Consumer (datan käyttäjä) Datan hyödyntäminen raporteissa ja päätöksenteossa Analyytikko tai liiketoimintapäällikkö
Dataneuvoksen mielipide

Älä yritä nimetä yhtä "kaiken datan omistajaa" — se johtaa pullonkaulaan ja vastuun pakoiluun. Omistajuus kannattaa jakaa tietoalueen mukaan: HR-data HR-johdolle, talousdata CFO:n alaisuuteen ja niin edelleen. Tärkeintä on, että jokaisella kriittisellä tietoaineistolla on nimetty henkilö, joka osaa vastata kysymykseen "onko tämä data oikein?"

Miten datan laatu varmistetaan?

Datan laatu on data governancen ydin. Laadukas data on täydellistä, tarkkaa, ajantasaista, johdonmukaista ja käyttökelpoista tarkoitukseensa. Laadunvarmistus ei tapahdu kertaluonteisesti, vaan se vaatii jatkuvaa seurantaa ja prosesseja.

Datan laadun ulottuvuudet:

Ulottuvuus Kysymys Esimerkki ongelmasta
Täydellisyys Onko kaikki tarvittava tieto tallessa? Asiakkaalta puuttuu sähköpostiosoite
Tarkkuus Vastaako data todellisuutta? Puhelinnumero on kirjoitettu väärin
Ajantasaisuus Onko data riittävän tuoretta käyttötarkoitukseen? Asiakkaan osoite on päivittämättä muuton jälkeen
Johdonmukaisuus Onko sama tieto samassa muodossa eri järjestelmissä? Sukupuoli koodattu "M/N" yhdessä ja "Mies/Nainen" toisessa
Ainutlaatuisuus Onko samaa kohdetta kuvaavia rivejä vain yksi? Sama asiakas löytyy kahdesti eri kirjoitusasulla
Dataneuvoksen mielipide

Rakenna laadunvalvonta suoraan tietovirtaan, älä tee siitä erillistä tarkistusprosessia. Kun laadun mittaaminen on automatisoitu ETL- tai ELT-prosessiin, saat hälytykset ongelmista heti — et vasta kun raportti on mennyt johdolle väärillä luvuilla. Power BI:ssä kannattaa luoda erillinen "Data Quality" -sivu, jossa keskeisten taulujen laadun mittarit näkyvät selkeästi vastuuhenkilöille.

Mitä on metadatan hallinta?

Metadata on dataa datasta — tieto siitä, mitä data tarkoittaa, mistä se tulee, milloin se on päivitetty ja kuka siitä vastaa. Metadatan hallinta tekee datasta ymmärrettävää ja löydettävää koko organisaatiolle.

Metadataa on kahta päätyyppiä:

Datakatalog on työkalu, johon metadata kerätään yhteen paikkaan. Se toimii organisaation "datakirjastona", josta kuka tahansa voi etsiä mitä dataa on saatavilla, mitä se tarkoittaa ja keneltä saa lisätietoa.

Dataneuvoksen mielipide

Älä aliarvioi liiketoimintametadatan arvoa. Tekninen metadata syntyy usein automaattisesti järjestelmistä, mutta liiketoimintakonteksti — miksi tämä sarake on olemassa, mitä "aktiivinen asiakas" tarkalleen tarkoittaa organisaatiossanne — täytyy dokumentoida itse. Aloita täyttämällä liiketoimintakuvaukset 10–15 tärkeimmälle sarakkeelle. Se on pienikin työmäärä, mutta vaikutus analytiikan luotettavuuteen on huomattava.

Miten GDPR ja tietosuoja liittyvät data governanceen?

GDPR (yleinen tietosuoja-asetus) on keskeinen osa data governancea kaikkialla EU:ssa. Se asettaa vaatimuksia henkilötietojen käsittelylle ja edellyttää, että organisaatiolla on selkeä käsitys siitä, mitä henkilötietoja heillä on, missä ne sijaitsevat ja mihin niitä käytetään.

Data governancen kautta GDPR:n vaatimuksiin vastataan mm. seuraavasti:

Dataneuvoksen mielipide

GDPR ei ole pelkästään IT:n tai juristin asia — se koskee jokaista, joka käsittelee henkilötietoja. Data governance -ohjelman avulla tietosuojavaatimukset saadaan osaksi normaalia toimintaa sen sijaan, että ne ovat erillinen tarkistuslista auditointeja varten. Erityisesti Power BI -raporteissa kannattaa merkitä selkeästi, mitkä raportit sisältävät henkilötietoja, ja varmistaa, että Row-Level Security on konfiguroitu oikein ennen jakelua.

Miten hallinnoidaan datan elinkaarta?

Datan elinkaari kattaa kaikki vaiheet datan syntymästä sen poistamiseen: kerääminen, käsittely, tallennus, käyttö, arkistointi ja hävittäminen. Elinkaaren hallinta varmistaa, että data on saatavilla silloin kun sitä tarvitaan, mutta vanhentunut tai tarpeeton data ei kuormita järjestelmiä eikä aiheuta tietosuojariskejä.

Elinkaaren vaihe Kysymykset
Kerääminen Mitä dataa kerätään? Onko keräämiselle laillinen peruste? Kuka kerää?
Käsittely ja jalostus Miten raakadata muunnetaan käyttökelpoiseksi? Kuka vastaa laadusta?
Tallennus Missä data säilytetään? Miten pitkään? Miten se suojataan?
Jakelu ja käyttö Kenellä on pääsy? Mihin tarkoituksiin dataa saa käyttää?
Arkistointi Siirretäänkö data kylmään arkistoon vai säilytetäänkö aktiivisena?
Hävittäminen Milloin data poistetaan? Miten varmistetaan turvallinen poisto?
Dataneuvoksen mielipide

Monessa organisaatiossa data vain kertyy eikä kukaan mieti milloin se poistetaan. Tämä on sekä tietoturvariski että kustannuskysymys. Säilytysaikapolitiikka kannattaa tehdä samalla kun tietoaineisto otetaan käyttöön — ei sitten kun levytila loppuu tai tietosuojatarkastaja koputtaa ovelle. Yksinkertainen nyrkkisääntö: jos et osaa nimetä yhtään käyttötapausta datalle joka on yli kolme vuotta vanhaa, se kuuluu arkistoon tai roskakoriin.

Miten aloitetaan data governance -ohjelma?

Data governance -ohjelman käynnistäminen on muutoshanke, jossa organisaatiokulttuurin muutos on usein haastavampaa kuin tekninen toteutus. Onnistunut aloitus etenee tyypillisesti seuraavien vaiheiden kautta:

  1. Nykytilan arviointi — kartoita mitä dataa on, missä se sijaitsee ja ketkä sitä käyttävät
  2. Kriittisten tietoalueiden tunnistaminen — priorisoi alueet, joissa datan laatu tai hallinta aiheuttaa eniten ongelmia
  3. Omistajien nimeäminen — varmista liiketoimintajohdon tuki ja nimeä omistajat prioriteettialueille
  4. Sääntöjen ja standardien luominen — määrittele nimeämiskäytännöt, laadun kriteerit ja pääsykäytännöt
  5. Työkalujen valinta — valitse datakatalog ja laadunvalvontatyökalut tarpeen mukaan
  6. Koulutus ja viestintä — varmista, että kaikki ymmärtävät roolinsa ja hyödyt
  7. Jatkuva kehittäminen — mittaa tuloksia ja laajenna ohjelmaa asteittain
Dataneuvoksen mielipide

Suurin sudenkuoppa on yrittää tehdä kaikki kerralla. Data governance ei ole projekti jolla on loppupäivämäärä — se on jatkuva toimintatapa. Aloita yhdellä voitolla: valitse yksi ongelma-alue, korjaa se data governancen keinoin ja kommunikoi tulos näkyvästi. Onnistumiset rakentavat luottamusta ja tekevät laajentamisen helpommaksi. Johdon tuki on välttämätöntä — ilman sitä ohjelma kuolee ensimmäiseen muutosvastarintaan.