ARTIKLA   Ⅰ Ⅱ Ⅲ Ⅳ • Ⅴ • Ⅵ • Ⅶ • Ⅷ • Ⅸ • Ⅹ

datatuomioistuin

Tämä on Datatuomioistuin. Täällä datan oikeudet ovat ihmisoikeuksia.

(SFÄÄRI) Yllä manifestoitu hokema vaatinee hieman selvennystä täältä sfääreistä käsin. Datatuomioistuimessa lausuntoa ajatellaan oletuksena siitä vinkkelistä, että datan oikeudet voidaan periyttää YK:n ihmisoikeuksien yleismaailmallisesta julistuksesta. Itse asiassa juuri näin on menetelty poimien rohkeasti kirsikat kakusta. Toinen näkökulma on, että toteutuessaan datan oikeudet ovat automaattisesti myös ihmisoikeuksien toteutumista edistäviä oikeuksia. Hurjimmat filosofiaan taipuvaiset mielet keksinevät paljon diipimpiäkin keloja aiheesta.

Mutta miksi tämä projekti? Syitä on monia ja tärkein liikkeelle sysännyt voima on ollut kirjoittajan opintoihin liittyvä lopputyö. Toinen syy on se, että datan huolellisen leipomisen tärkeys ei vaikuta menevän jakeluun saatika jalkautukseen isoissakaan yrityksissä ainakaan liian nopeasti. Tiedonhallinnan, datan kehittämisen, data-arkkitehtuurin ja businesskäyttäjien ym. kuplat hylkivät aivan liian tehokkaasti toisiaan. Nyrkkejä puidaan taskuissa ja huuto kuplan sisältä ei tunnu millään kantautuvan toiseen kuplaan. Kuplat kuplivat ja yhteistyö sakkaa.

Mikä avuksi? Datatuomioistuin pyrkii lähestymään dataan liittyviä kommervenkkejä ja kryptiikkaa huumoria muistuttavan tekstipöhön kautta. Ajatukset oikeuksista on puettu artiklojen muotoon. Jokainen artikla käsittelee oikeuksia eri näkökulmasta joskus jopa aiheessa pysyen, sen verran uskallan luvata. Näistä kirjoituksista löytyy enemmän mielipiteitä kuin faktaa, joten faktantarkistajat ja besserwisserit voivat kohdistaa energiansa vaikkapa SOTE-sektorin ATK-järjestelmien arvosteluun. Ei sillä, etteikö palaute kelpaisi, joten sitä voi antaa LinkedInissä Datatuomioistuin ryhmään liittymällä. Datatuomioistuimen kontsa-osaston haaveena on, että mahdollisimman laaja kirjo johtoryhmän (piuhaklubi) jäsenistä bitintunkkaajiin ja pisnestyypeistä raporttien kuluttajiin löytäisi inspiraatiota ja uudenlaista ymmärrystä näistä teksteistä.

Ilmoittaudu lautamieheksi Datatuomioistuimeen LinkedInissä! Parannetaan datan edellytyksiä toimia oikein kaikissa sen elinkaaren vaiheissa.

Sami Heinänen
Vt. laamanni/Datatuomioistuin, data pro – pro data, amatöörikynäilijä
https://datatuomioistuin.fi



ARTIKLA I

OIKEUS MERKITYKSEEN

"We create monsters and then we can't control them"

Joel Cohen


Dataa ei tule luoda ilman suunniteltua käyttötarkoitusta ja kontekstia.

Datalla on oikeus tulla havainnoiduksi ja tallennetuksi suunniteltua tarkoitusta varten sen elinkaaren ominaisuuksista riippumatta. Dataa tulee luoda aina tiedostetun kontekstin (tai useamman) näkökulmasta. Olkoonpa se tuotannollinen, taloudellinen, liiketoiminnallinen, yhteiskunnallinen tai vastuullisuuden näkökulma. Tulee ymmärtää, että sama data voi palvella erilaisia informaation käyttötarpeita. Siksi sen merkityksellisyyden pohdintaa ei voi ohittaa olankohautuksella ja jättää pelkästään ATK-osaston harjoittelijoiden vastuulle. Vaikka sanottakoon totuuden nimissä, että ATK-osaston harjoittelijat ovat usein varsin nohevia sekä avarakatseisia ja pystyvät kyllä taikomaan tyhjästä hyvinkin luovia ratkaisuja datan äitiyslaatikkoa suunnitellessa.

Lisäksi datalla on oikeus nauttia johdonmukaisesta elinkaarimallista ja saavuttaa esim. terminaalivaihe (engl. EOL, end of life), kun sille ei ole enää tarvetta. Luonnollisesti myös muihin elinkaaren vaiheisiin tulee päätyä suunnitelman mukaisesti eikä dumppaamalla kaikkea ryönäksi tulkittavaa pilvipalvelun arkistoon ihan vain kaiken varalta.

Luomalla dataa holtittomasti vailla kontrolleja sille ei ole nähtävissä kestävää tulevaisuutta. Riski tulla unohdetuksi kodittomaksi kiertolaiseksi ilman kontekstia, tietoa alkuperäisestä käyttötarkoituksesta tai muusta olennaisesta metatiedosta kasvaa, mitä vähemmän kontrolleja implementoidaan. Edessä voi olla tilanne, jossa ruumiinvalvojaisissa voideltua dataa ei saada laskettua haudan lepoon iäisiksi ajoiksi vaan se on tuomittu nousemaan sieltä uudestaan ja uudestaan Sisyfoksen lailla.

Datalla on oikeus minimointiin: sen keruuta tulee rajoittaa ja tallennusaikaa (retentioaika) säätää minimiin käyttötarkoituksen siitä kuitenkaan kärsimättä. Tätä periaatetta tulee soveltaa tietoisesti kaikessa datan keruussa, ei ainoastaan GDPR-asetuksen alaisen datan prosessoinnin osalta. Minimoinnin tarkoituksena ei ole kieltää datan keruuta kategorisesti. Sen tarkoitus on pikemminkin toimia yhtenä datan hallinnan työkaluna varmistamassa, että datan keruuta ei tarvitse miettiä uudestaan jalostusketjun loppupäässä.

Datan tallennushintojen romahdettua viime vuosina tallennuksen järkevyyttä ei ole juuri tarvinnut miettiä. Ehkäpä tämän myötä myöskään perusteita datan keruulle, metatiedon kuvaamiselle tai tietorakenteiden järkevyydelle ei ole tarvinnut miettiä yhtä pieteetillä kuin joskus viime vuosituhannella. Esimerkiksi hilpeällä 80-luvulla, jolloin ATK oli vielä ihan oikeaa ATK:ta ja sinistä luomiväriä ei ollut kenelläkään liikaa. Keskustietokoneita ohjelmoineet tai niillä operoineet muistavat, että kahdeksaan merkkiin piti saada ujutettua paljon merkitystä. Taisipa sama rajoite koskea varhaisia Windows-versioitakin.

Artiklan I loppusanoina todettakoon: käyttämättömän datan arvo on nolla. Nada. Zero. Datalla ei myöskään ole merkitystä ellei se palvele suunniteltua käyttötarkoitusta oikeassa asiayhteydessä. Vasta käytön myötä datasta voi tulla arvokasta. Ja merkityksellistä. On sanottu, että datan kohtalonhetket ovat sen syntymä ja sen käyttöhetki. Data, joka syntyy tuntemattomana vaillinaisiin olosuhteisiin ilman tietoa tarkoituksesta on merkityksetöntä. Datalla on oikeus merkitykseen. Ja moneen muuhun seikkaan, joista lisää seuraavissa artikloissa.

Tervetuloa Datatuomioistuimeen!

ARTIKLA II

OIKEUS ELINKAAREEN.

"What are you going to do him? Hang him, boil him, or stuff him?"

Little My, Moominsummer Madness


Datalla on oikeus syntyä, olla olemassa ja kuolla hallitusti ja suunnitelmallisesti.

(RIEMUKAARI) Datalla on siis oikeus elinkaareen. Olkoot ne vaiheet syntymä, keittäminen, täytetyksi tuleminen tai hirttäminen. Tai kaikkea näitä, mikä ikinä onkaan merkityksen ja kontekstin kannalta oleellista. Miksi tästä oikeudesta tulee olla kiinnostunut?

Ennen kuin jatkamme, lienee kohteliasta huomioida vähemmän datageenejä ilmentävät kanssasiskot ja veljet, jotka saattavat kaivata tässä kohtaa pientä johdantoa aiheeseen. Ja kuten aina ATK-juttuloissa määritelmä riippuu määrittäjästä mutta rohkenen tiivistellä asiaa suurin piirtein näin: datan elinkaaren hallinnan voidaan ajatella koostuvan mm. menettelytavoista, työkaluista ja osaamisen kartuttamisesta koulutuksen kautta.

Kyseessä on siis puitteet, jonka raamien sisällä em. säännöskokoelmia ja tekniikoita harjoitetaan. Ihan käytännön elämässä tämä tarkoittaa esim.

  • datan keräämistä
  • putsausta
  • tallennusta
  • prosessointia
  • käyttöä (operatiivinen ja analyyttinen) ja
  • lopuksi poistoa
  • Kaikki tämä ennalta määritettyjen, yhteisesti sovittujen ja oikea-aikaisesti toteutettujen sääntöjen puitteissa. Simppeliä!

    Asia, joka itseäni on hämmentänyt kautta vuosituhansien (kyllä, olen elänyt viime vuosituhannella) on tässäkin tieteenhaarassa usein läsnä oleva liiketoimintanäkemyksen puute. Kokemukseni mukaan suuri osa kirjallisuudesta keskittyy asiaan varsin mekanistisesti (jota elinkaaren hallinta toki on) unohtaen syvällisemmän pisnesanalyysin. Ja vieläpä sellaisen analyysin, joka ei keskity pelkästään kaivamaan hohtimilla liiketoimintajohtajan korvien välistä sääntöjä säilytysajalle tai puhdistussäännöille.

    Tarkoitan niitä seikkoja, jotka ovat liiketoiminnalle tärkeitä ymmärtää, kuten ”miten voimme hyötyä täsmällisestä ’asiakkuuden tila’ -tiedosta” tai ”haluamme luottaa siihen, että datasetissä ei ole poistuneita asiakkaita” tai ”emme saa uusia tuotteita tarpeeksi nopeasti verkkokaupan valikoimaan, kun hyväksyntäprosessi on niin sekava” jne. Kun nämä asiat eivät ole jiirissä, dataa on helpompi syyttää kuin katsoa peiliin.

    Kyseessä voidaan mieltää olevan myös metadataharjoitus, jossa datan kyljessä kulkee koko ajan mukana tieto sen elinkaaren vaiheesta. Tämä vaatii luonnollisesti kokonaisvaltaista suunnittelua metadata-kerroksessa. Elinkaariasiaa voidaan miettiä myös data-arkkitehtuurin kautta, esimerkkinä vaikkapa Medallion arkkitehtuuri. Tärkeintä on, että datalla ymmärretään olevan eri tiloja elinkaarensa aikana. Ja että nämä tilat mallinnetaan vastaamaan liiketoimintatarpeita ja siirtymät niiden välillä eivät ole satunnaisia ja sinnepäin vaan hallittuja ja suunniteltuja. Datalla on siis oikeutensa elinkaareen, jotta se voi palvella käyttäjäänsä asianmukaisella pieteetillä.

    Seuravassa artiklassa, Artikla III, käsitellään datan oikeutta rakenteisiin ja minimaaliseen keräämiseen. Arvioitu julkaisu on 9.2.2026 alkavalla viikolla.

    EDIT 20.2.2026: Artikla III päättikin viedä kirjoittajan metadatan pariin, joten aiheesta lisää seuraavassa.

    ARTIKLA III

    OIKEUS METADATAAN.

    You can have data without information, but you cannot have information without data.

    Daniel Keys Moran


    Datalla on oikeus tulla tallennetuksi standardoiduin metatiedoin, jotka ovat yhteensopivia eri järjestelmien kesken.

    (METATEHTAAN PROPAGANDAJAOS 20.2.2026) Ja kuten joskus käy, tämän artiklan julkaisu venähti heittämällä 16.2.2026 alkavalle viikolle. Sori siitä mutta ei kuin eteenpäin!

    Ponnistellaanpa aihetta kohti perusteista käsin ja tässä meitä Wikipedia sivistäköön: ”Metatieto (metadata, liitännäistieto, kuvailutieto) on tietoa tiedosta eli kuvailevaa ja määrittävää tietoa jostakin tietovarannosta tai sisältöyksiköstä. Esimerkiksi tyypillistä metatietoa ovat CD-levyn tiedot (levyn nimi, esittäjä, säveltäjä, päivämäärä) tai tekstidokumentin tiedot (viimeksi tallennettu, omistaja, versio, sijainti, julkaisupäivämäärä jne.). Metadatan jalo tarkoitus on ollut myös parantaa tietojen siirrettävyyttä ja eri paikoissa olevien sisältöjen yhdistämistä. Eikä pidä unohtaa löydettävyyttä; jo 90-luvulla internetskisivujen tekijät näppäilivät kilvan metatageja HTML-lähdekoodiin, jotta Googlen hakukonerobotti löytäisi oikeat hakusanat indeksiinsä lisättäväksi. Vuonna 2026 samat asiat tarkoitusperät pätevät edelleen: datahippuskokoelmat janoavat liitännäistietoa, jotta ne voidaan löytää, siirtää, yhdistää ja sosiaalistaa muiden kanssa hedelmälliseen dialogiin.

    Internetin ideaalipuheissa metadatan hallinta tuottaa etua ”parantamalla löydettävyyttä, laatua ja tietosuojaa mahdollistaen datan transformaation toimintakelpoiseksi näkemykseksi”. Mainittakoon, että keinoälyn yhteenveto tietää kertoa myös, että ”metadatan hallinta parantaa operatiivista tehokkuutta nopeamman datan haun kautta, karsia kuluja tunnistamalla toisteisen datan ja mahdollistaa toimialaa sääntelevän regulaation ja lainsäädännön yhteensopivuuden” (lainausten suomennos on toimituksen tihutöitä). Jos haistoitte ironiaa ”internetin ideaalipuheissa”, juuri sitä viljelin mielessäni. Edellä kuvattu proosa on toki sinänsä validia, mutta siitä puuttuu se väkevyys ja rahankäry, jolla metadatahankkeelleen voi saada rahoitusta.

    Kokeilepa aloittaa piuhaklubin (johtoryhmä) pitsaaminen sanoilla ”Investoimalla metadatan hallintaan voimme parantaa datan löydettävyyttä, laatua ja tietosuojaa mahdollistaen datan transformaation toimintakelpoiseksi näkemykseksi”. Voit hyvinkin saada vastaukseksi ”Aha, okei, en tajunnut puoliakaan enkä ymmärrä miksi tämä maksaa meille 50 kEUR vuodessa 150 kEUR alkuinvestoinnin jälkeen”. Luvut ovat toki Harryn stetsonista peräisin mutta eivät mitenkään epärealistisia kokemukseni mukaan. Moisia lukuja ei voi heittää piuhaklubin areenalle ilman vastalaskelmia.

    Onneksi internet on laskenut näitäkin asioita meille valmiiksi! Esimerkkinä pitsauksen keulille voi kokeilla ”Metadatan hallinnan kehittämisestä on hyötyä esimerkiksi Cost Per Leadin alentamisesta (esimerkki: 225 eur -> 67 eur), aikasäästö ja tuottavuus (esimerkki: velhojen työajasta kuluu 50% datan kanssa vehtaamiseen – paremman metadatan avulla voidaan saavuttaa 70-85% tuottavuusloikka koodaamisen ja datan haun osalta)”. Esimerkkejä on pilvin pimein ja tärkeintä on valita oikea lähestymiskulma: operatiivinen tehokkuus, tiedonhallinnan kustannukset, liikevaihdon kasvu, automatisoitu data governance, AI-avusteinen tiedon luokittelu, datan demokratisointi jne…

    Palataanpa vielä datan oikeuksiin metadataan liittyen. Vanhan liiton passiivinen lähestymistapa metadataan alkaa lähennellä syytekynnystä Datatuomioistuimessa. Tässä lähestymisessä metadataa ajatellaan kertajumppana, jossa dataan liimataan jotain staattista, jota kukaan tai mikään ei sen kummemmin käytä. Tähän eetokseen liittyy olennaisesti sponsorin ja omistajuuden puute sekä hankalien työkalujen soveltaminen, jolla varmistetaan, että kukaan ei varmasti innostu metadatan huollosta. Hieman modernimpi lähestyminen halailee ”aktiivisen metadatan” käsitettä, jossa automatisoidaan, monitoroidaan ja toimitaan metadatan parissa (lähes) reaaliajassa. Kaiken päälle näppärä Data Governance päällikkö livauttaa metadatan keräämisen osaksi datan veivaamista ja analyysia. Ja keskittymällä puheissaan eurojen kehräämiseen datajengillä on kaikki mahdollisuudet nostaa data keskiöön ja mahdollistaa sille Artikla III mukaiset oikeudet.

    Ja tuttuun tapaan, jatkot LinkedInissä: liity julkiseen ryhmään Datatuomioistuin. Meitä on jo yli kolmekymmentä ja orastavaa jutusteluakin on ollut havaittavissa, kiitos kaikille! Seuraava artikla käsittelee datan oikeutta omistajuuteen ja siihen liittyviin näkökulmiin. Otsikko on toivottavasti julkaistavissa ensi viikolla.

    ARTIKLA IV

    OIKEUS OMISTAJUUTEEN

    The time is always right to do what is right.

    Martin Luther King, Jr.


    Datalla on oikeus omistajaan, joka on vastuussa sen hyvinvoinnista tarjoten mm. turvaisan ja suojatun elinympäristön ja tarkoituksenmukaisesta käytöstä.

    (ASIAINOMISTAJAN KULMAHUONE 18.3.2026) Ja kuten kävi tälläkin kertaa, tämä artikkeli se vasta venähtikin, koska elämä. Joten taas kerran, sori siitä mutta ei kuin eteenpäin!

    Omistajuuden teema vierähti ulos toimituskokouksesta jo viikkoja sitten ja tässä sitä ollaan vihdoin keräilemässä menneiden viikkojen aivopierteiden sirpaleita yhteen. Tämän ja edellisen artiklan välissä allekirjoittanut sai kunnian pitää vierailijaluennon Karelia AMK:ssa tiedonhallinnan opiskelijoille ja sen valmisteluhan vei oman tovinsa, eikä myöskään pidä unohtaa ihanan aktiivista data governance palkkatyötä! Onneksi edellä mainituissa pöhinöissä oli yhteisenä punaisena lankana nimenomaan datan omistajuuden teema. Ja täällä se muuttuu luonnollisesti datan oikeudeksi.

    Mutta mitäpä se sitten on, se sellainen datan omistajuus? Lontoon herrojen ja ladyjen kielellä data ownership. Ystävämme internetissä, Iso Kielimalli kertoo yhtenä todennäköisenä arviona notta että ”datan omistajuus viittaa organisaation informaatiovarantojen käsittelyyn, kontrollointiin ja velvollisuuksiin mitä tulee datan pääsynhallintaan, luontiin, muokkaamiseen tai kuluttamiseen”. Minä kyllä lisäisin perään vielä tappamisen, tai ehkä sivistyneemmin ilmaistuna eutanasian tai ennalta sovitun hoitotahdon mukaisen hoidon.

    Datan omistajuus herätti ainakin yhdessä tutussa laskentainsinöörissä hyviä kysymyksiä, kun artikla IV:n aihe julkaistiin Datatuomioistuimen vertaistukiryhmässä. Ehkä kysymysryöpsähdyksen voisi tiivistää jotenkin näin:

    1. Missä menee omistajuuden rajat? Ovatko ne data domaineissa, prosessien reunoilla vai omistajan vauhkossa mielikuvituksessa?

    2. Onko omistajalla valtaa päättää? Vai onko omistaja vain rampa ankka, jonka niskoille vieritetään kaikki syyt ”koska meidän datamme on paskaa”.

    Vastauksina tarjoilen seuraavia sihdattuja aatoksia: omistajuuden rajat sovitaan yhdessä siten, että ne tuntuvat luontevilta liiketoiminnan näkökulmasta eivätkä vuoda liikaa kaverin tontille. Apuna voi käyttää jotain lukuisista alan kirjallisuuden malleista, jotta voidaan nojata myös tieteelliseen puoleen ja näyttää asiallisilta paperilla. Omistajuuden päätösvaltaan liittyen, totta kehvelissä omistajalla pitää olla valtaa! Jos hänen odotetaan vastaavan datasta ja resursoivan sen kehittämisen, on päivänselvää, että omistaja myös päättää emännän tahi isännän elkein datan hoidosta. Kasvatusvastuu on huoltajalla. Ugh. Saa olla eri mieltä ja suorastaan toivonkin jonkun ottavan kantaa, jotta saataisiin luotua omistajuuden malli, joka ei karkota potentiaalisia dataomistajia 110 metrin aitajuoksuun toimiston pöytien yli.

    Haluan palata kuitenkin hieman takaisinpäin omistajuuden konseptiin. Yleisesti ottaen datan omistajuuteen ajatellaan kuuluvan muutama keskeinen rooli: omistaja (data owner), tiedonhuoltaja (data steward) ja joissakin malleissa vielä lisäksi huoltaja (data custodian). Omistajat määrittävät tai sanoisinpa että etupäässä johtavat, tiedonhuoltajat käsittelevät ja huoltajat implementoivat tekniset seikat. ”Konseptihan on vallan yksinkertainen, miksei se ole jo käytössä?”. Menemättä kaikkiin mahdollisiin syihin totean ensin, että paperilla nämä nimitykset on helppo tehdä ja näin asiaa kysynyt pysyy tyytyväisenä hetken aikaa. Ja sitten pientä jerryä tähän, miksei mitään tapahdu: todellisuudessa nimetyt henkilöt eivät tiedä mitä heiltä odotetaan, heitä ei kouluteta ja tuloksien mittaamisesta ei ole mitään yhteistä sopimusta. Loppujen lopuksi etsitään syyllinen, joka varsin usein on se ”paska data”. Tai sitä ylläpitävä alustatiimi, jonka syytä kaikki organisaatiossa loisiva pytynloiske muka on. Ja jos vielä keritään hieman syy-seuraussuhteita niin väitänpä, että mitään ei tapahdu, koska kenenkään vastuulla ei ole laittaa omistajuuden konseptia pystyyn ja seurata sen kehittymistä organisaatiossa. Niinpä jäljelle jää ”Joku”, jota ei olemassa ja jonka vastuulla kaikki on. Myös paska data. Noin, tulipahan kiroilta riittävästi!

    Jonkinasteinen yhteenveto lienee paikallaan tässä vaiheessa, jotta teksti ei täysin mene vallan puuduttavaksi hallusinoinniksi. Sanotaan siis vielä kerran, että koska data on kuin avuton poikanen, jota pitää hoivata kehdosta hautaan, se tarvitsee omistajan, joka osaa ja jolla on valta pitää siitä huolta. Jos data jää orvoksi orvokiksi alusta asti, ei sillä ole arvoa ja se on vain hyödytöntä levyn täytettä, kunnes joku päättää sen lahdata kevätsiivouksen yhteydessä. Jotta data voisi palvella omistajaansa riemuiten, tulee sillä olla oikeus sellaiseen. Varsinainen kehäpäätelmä, huh.

    Loppuun tutut lausekkeet: liity Linkkarissa julkiseen ryhmään Datatuomioistuin. Meitä on jo yli neljäkymmentä, kiitos kaikille liittyneille! Seuraava artikla (aihe vielä auki) tulee pihalle toivottavasti viikon sisään ja loput samassa tahdissa, sillä Datatuomioistuimen manageritoimiston korvanappiin on kantautunut tieto, jonka mukaan piipahdus digitaalisen verkon podsfäärissä voisi tapahtua kevään aikana! Tuomioistuimen kehitystyöryhmä on asiasta varsin innoissaan ja onkin jo varannut ajan parturiin ja tilannut perhepaketin kurkkupastilleja puheentuoton sujuvoittamiseksi!