Hyppää pääsisältöön

Miten Yle voisi hyödyntää Big Dataa?


Anniina Huttunen on tekijänoikeuslakimies Ylen lakiosastolla.

Euroopan komissio antoi heinäkuussa tiedonannon datavetoisesta taloudesta. Tiedonannossa kirjoitetaan uudesta teollisesta vallankumouksesta, jonka osatekijöinä ovat digitaalinen data, tietokoneistuminen ja automatisoituminen. Kehitykseen liittyvät myös pilvipalvelut, jotka palvelevat datataloutta vastaavasti kuin voimalaitokset palvelevat tuotantoteollisuutta.

Big Data, Open Data, My Data?

Big Datalla (iso data, massadata) ei ole yhtä vakiintunutta määritelmää, vaan se määritellään eri asiayhteyksissä eri tavoin. EU-komission tiedonannossa big data määritellään suuriksi määriksi erityyppistä dataa, joka tuotetaan suurella nopeudella erittäin monista erityyppisistä lähteistä.

Open Data (avoin data) puolestaan käsitetään dataeräksi, jota kaikki saavat käyttää vapaasti niin kaupallisissa kuin ei-kaupallisissa tarkoituksissa. Avoin data tuo hallinnon lähemmäs kansalaista ja vuorovaikutus yksilöiden ja hallinnon välillä paranee. Lisäksi avoin data voi toimia liiketoiminnan raaka-aineena.

Liikenne- ja viestintäministeriön 14.8.2014 julkaisemassa raportissa ”Big Datan hyödyntäminen” luodataan myös My Datan (omadata) käsitettä. Se liitetään toimintakulttuuriin, jossa yksilö voi hyödyntää organisaation palauttamaa yksilökohtaista tietoa. Tieto voi olla joko raakadataa tai jalostettua dataa, joka on esimerkiksi visualisoitu.

Kohti ihmiskeskeistä henkilötiedon hyödyntämistä

Data voi olla niin koneen antureiden tuottamaa kuin ihmiseen kiinteästi liittyvää henkilötietoa. Liikenne- ja viestintäministeriön rahoittamassa, omadataa koskevassa selvityksessä (tekijöinä Antti Poikola, Kai Kuikkaniemi ja Ossi Kuittinen, Open Knowledge Finland) nostetaan ihminen keskiöön.

Selvitys on tärkeä keskustelunavaus, joka on toteutettu yksityisyydensuoja edellä Privacy by design -hengessä. Selvityksessä korostetaan, että datan hyödyntämisen ja tietosuojan yhteensovittamisen yhtälö voidaan ratkaista vahvistamalla yksilön mahdollisuuksia heitä koskevien tietojen hallintaan. Tiedon keräämistä voidaan tarkastella niin yksilöiden kuin organisaatioidenkin näkökulmasta. Selvityksessä nostetaan omadata digitaalisen ajan ihmisoikeudeksi. Samalla kuitenkin muistutetaan, että kyse on myös uusista liiketoimintamahdollisuuksista.

Data haastaa

Immo Salon mukaan datan määrän kasvu asettaa haasteita datan säilyttämiselle, datan siirtämiselle ja datan ymmärtämiselle. Tarvitaan yhä parempia tallennusratkaisuja, tietoliikenneyhteyksiä ja analytiikkaa.

Kuten liikenne ja viestintäministeriön Big Data -raportissa korostetaan, datan hyödyntäminen edellyttää organisaatiorajat ylittävää yhteistyötä. Toiselle arvoton data saattaa olla toiselle hyvinkin arvokasta. On siis hyödynnettävä organisaation omaa dataa ja samalla suunnattava katse ympäröivään ekosysteemiin.

Raakadata ei itsessään riitä, vaan on osattava myös organisoida ja analysoida sitä. Tarvitaan monialaisia tiimejä, jotka koostuvat data-analyysin, koneoppimisen ja visualisoinnin asiantuntijoista. Big datan hyödyntämisen ei tule tapahtua erillisenä saarekkeena, vaan dataa on osattava käyttää kaikissa organisaation toiminnoissa.

Datatietoisuuden lisääminen

Liikenne- ja viestintäministeriön Big Data -raportissa korostetaan datatietoisuuden lisäämistä. Datatietoisuus tarkoittaa sitä, että ymmärretään datan potentiaalinen arvo ja riskit. Datatietoisuuteen liittyy myös datan tarkastelun rajojen kyseenalaistaminen, uusien lähteiden tunnistaminen ja jo edellä mainittu ulkoisten ja sisäisten lähteiden huomioiminen.

Näin tekijänoikeuslakimiehenä riskeistä ensimmäisenä mieleen tulevat henkilötietojen suojaan ja tekijänoikeuteen liittyvät sääntelykysymykset. Big data haastaa myös lainsäätäjän. On pohdittava, tarvitaanko tiedonlouhintaan liittyviä poikkeuksia tekijänoikeuslakiin. Datan yhdistely eri lähteistä haastaa taas henkilötietojen suojaan liittyvän lainsäädännön. Myös omadataselvityksessä todetaan, että sääntelyllä voi olla niin kiihdyttävä kuin hidastava vaikutus. Lainsäädäntö ei kuitenkaan yksin takaa muutosta. Voidaan ajatella, että lainsäädäntö on muutoksen moottori, mutta polttoaine on saatava yksilöiltä ja organisaatioilta.

Lisäksi sopimusasiantuntijoiden on löydettävä oikeat lausekkeet, jotka kattavat niin jatkokäytön kuin alkuperäisen käytön. Aina henkilötietoja kerättäessä ei osata aavistaa, mitä mahdollisuuksia data tarjoaisi.

Liikenne- ja viestintäministeriön raportissa korostetaan, että Big data tarjoaa ratkaisuja suuriin yhteiskunnallisiin ongelmiin. Big dataa hyödynnettäessä on muistettava niin datan arvo kuin siihen liittyvät riskit.

Big data mediatoimialalla

Mediatoimialalla big dataa voi ajatella hyödynnettävän sekä sisällöllisissä innovaatioissa (datajournalismi ym.) että kaupallistamisen kehittämisessä (käyttödatan parempi hyödyntäminen sekä mainostaja-asiakkaiden että kuluttaja-asiakkaiden palvelukokemus). Esimerkiksi vaalikonedataa voidaan avata jatkokäyttöä varten. Dataa hyödyntämällä myös kulttuuri ja taide voivat omilla keinoillaan kiinnittää huomiota yhteiskunnallisiin ongelmiin.

Yle haluaa kehittyä datatietoisena organisaationa:

- Kehitetään tietoa paremmin tuottavaa asiakaspalaute- ja asiakasdialogijärjestelmää.

- On aloitettu palveluiden käyttödatan avaaminen.

- Rakennetaan avointa rajapintaa (API) Ylen sisältöjen ja niihin liitettyjen metatietojen avaamiseksi myös ulkopuolisten sovellusten käyttöön.

Millaista innovointia ja edelläkävijyyttä Yle voisi mielestänne näyttää datan hyödyntämisessä?

Kuva: CC BY 2.0 Yle Arkisto

Lähteet:

COM2014(442) Kohti menestyvää datavetoista taloutta. http://ec.europa.eu/transparency/regdoc/rep/1/2014/FI/1-2014-442-FI-F1-1.Pdf

Liikenne- ja viestintäministeriön 13.8.2014 julkaisema raportti Big Datan hyödyntäminen

http://www.lvm.fi/julkaisu/4417803/big-datan-hyodyntaminen

Immo Salo: Big data – tiedon vallankumous. Jyväskylä 2013.

Marjut Salokannel: Julkisesta datasta avoimeen dataan – Julkisen datan lisensiointi.

http://www.etla.fi/wp-content/uploads/2012/09/dp1277.pdf

Antti Poikola, Kai Kuikkaniemi ja Ossi Kuittinen (Open Knowledge Finland): My Data – johdatus ihmiskeskeiseen henkilötiedon hyödyntämiseen. (Liikenne- ja viestintäministeriön rahoittama selvitys)

http://www.lvm.fi/julkaisu/-/view/4420389

Kommentit