Big data

Tämä sivusto tuhoutui tekniseen vikaan 11.3.2021 ja on uudelleen pystytetty käyttäen osaa tiedosta, joka saatiin pelastettua.

Big data tai massadata on erittäin suurten, järjestelemättömien, jatkuvasti lisääntyvien tietomassojen keräämistä, säilyttämistä, jakamista, etsimistä, analysointia sekä esittämistä tilastotiedettä ja tietotekniikkaa hyödyntäen.

Big data ei ole yksiselitteinen käsite ja siksi se on määritelty kyselyyn vastaajien ohjaamiseksi. Saadut tilastoluvut antavat hyvän käsityksen big datan käytön yleisyydestä, mutta käsitteen hankaluuden vuoksi saatuihin tilastolukuihin sisältyy jonkin verran epävarmuutta.

Kyselyä varten big data ja sen analysointi määriteltiin kyselyyn seuraavasti:

Big data syntyy erilaisista sähköisistä toiminnoista ja koneiden välisestä kommunikaatiosta (esim. data, jota syntyy tuotantoprosesseista tai sosiaalisen median käytöstä).

Big datalla on tyypillisesti seuraavia ominaisuuksia:

  • Dataa on hyvin suuria määriä
  • Datan muoto vaihtelee ja se voi olla rakenteellista tai ei-rakenteellista (esim. tekstiä, loki-tietoja, koordinaatteja, sensoridataa, klikkausdataa (clickstream data), kuvia, ääntä)
  • Dataa kertyy, muuttuu ja tulee saataville nopeasti

Big data -analyysilla tarkoitetaan tässä tekniikoiden, teknologian ja ohjelmatyökalujen käyttöä big datan analysointiin. Analysoitava big data voi olla kerätty yrityksen omista lähteistä tai muista datalähteistä.

Big dataa on käyttänyt hyväksi 19 prosenttia yrityksistä. Toimialoittain big dataa on yleisimmin käytetty informaation ja viestinnän toimialalla 42 prosentissa yrityksistä ja harvimmin vähittäiskaupan toimialalla 10 prosentissa yrityksistä. Pienimmistä 10–19 henkilöä työllistävistä yrityksistä 16 prosenttia ja suurimmista vähintään 100 henkilöä työllistävistä yrityksistä 34 prosenttia on käyttänyt big dataa.

Kysytyistä big datan lähteistä yleisimmin yritykset käyttivät sosiaalisen median tuottamaa dataa (9%). Dataa yrityksen omista älylaitteista tai sensoreista käytti kahdeksan prosenttia ja sijaintitietoja kannettavista laitteista seitsemän prosenttia yrityksistä.

Toimialoittain eri big datan lähteitä tarkasteltaessa yleisimmin sosiaalisen median dataa on käytetty informaation ja viestinnän (25%) sekä ammatillisen, tieteellisen ja teknisen toiminnan (22%) toimialoilla, dataa yrityksen omista älylaitteista tai sensoreista informaation ja viestinnän (17%), ammatillisen, tieteellisen ja teknisen toiminnan (13%) sekä teollisuuden (12%) toimialoilla ja sijaintitietoja kannettavista laitteista kuljetuksen ja varastoinnin (16%), informaation ja viestinnän (14%) sekä ammatillisen, tieteellisen ja teknisen toiminnan (13%) toimialoilla. (Liitetaulukko 4).

Big dataa käyttäneistä yrityksistä 68 prosenttia teki itse analyysejä big datasta ja 45 prosenttia käytti analyysien tekemiseen ulkopuolista palveluntarjoajaa. Sekä itse että ulkopuolisen palveluntarjoajan tekemänä analyysejä big datasta teki 23 prosenttia big dataa käyttäneistä yrityksistä.

Yleisimmin big datasta on itse tehty analyysejä informaation ja viestinnän (89%) sekä ammatillisen, tieteellisen ja teknisen toiminnan (82%) toimialoilla ja selvästi harvimmin vähittäiskaupan toimialalla (30%). Vastaavasti big datasta on teetetty analyysejä ulkopuolisilla yleisimmin vähittäiskaupan (65%) sekä majoitus- ja ravitsemistoiminnan (62%) toimialoilla ja harvimmin kuljetuksen ja varastoinnin (29%) sekä informaation ja viestinnän (29%) toimialoilla.

Lähde: Tietotekniikan käyttö yrityksissä 2018, Tilastokeskus

Koska dataa tuotetaan ja kerätään lähes käsittämättömän paljon päivässä, kerättyä dataa kaivelemalla voidaan löytää yllättävää tietoa. Henkilötietojen onkimisen ja muiden hieman karmivien esimerkkien lisäksi massadatan avulla voidaan rakentaa esimerkiksi jalkapallokoosteita liukuhihnalta työstävä kone.

Big data voi olla yritysten hyödyksi strategiaa linjatessa, operatiivisia päätöksiä tehdessä tai uusia liiketoimintamalleja luodessa. Tietovarannon lisäksi tarvitaan analytiikan ja algoritmien osaamista sekä dataorientoitunutta asennetta.

Big datan hyödyntäminen olemassa olevassa liiketoiminnassa edellyttää:

  • Johdon ymmärrystä ja sitoutumista datan hyödyntämiseen.
  • Big dataa hyödynnettävässä muodossa ja laadultaan riittävänä.
  • Teknisiä taitoja, kuten analyysi- ja algoritmiosaamista.
  • Organisatorisia kyvykkyyksiä ja tahtoa hyödyntää dataa toiminnassa.
  • Hyöty ei ole itsestään selvää. Datan ja organisaatiotekijöiden lisäksi ekosysteemi ja kilpailuasetelma, jossa yritys toimii, määrittävät onnistumista big datan tuomissa liiketoimintahyödyissä.
  • Myös teknologiaan liittyy riskejä.