Käsittele dataa näin: viisi vinkkiä!

20.6.2024Lotta Hakkarainen & Jari KyngäsUutiset

Datasta on tullut modernin yhteiskunnan valuutta, ja sen käsittelyyn tarvitaan sekä taitoa että oikeita työkaluja. Olit sitten yrittäjä, opiskelija tai tutkija, alla olevat vinkit auttavat sinua navigoimaan datan maailmassa tehokkaasti ja älykkäästi.

Kuvassa oikealla mies värikkäässä paidassa istumassa mietiskelevän näköisenä.
Tiedolla johtamisen edelläkävijä hankkeen erikoistutkija Jari Kyngäs. Kuva: Riku Kuparinen

Datan käsittely ja analysointi aloitetaan selvittämällä millaista dataa tarvitsemme ja mihin me sitä haluamme käyttää. Aloittaessasi sinun pitää myös miettiä, mistä saat dataa, jota haluat käsitellä.

1. Selvitä ensin, haluatko saada datasta ”silmäiltävää” (visuaalista) tietoa vai kenties syvempää analyysiä. Visuaalinen datan tarkastelu on monesti täysin riittävää. Erityisesti silloin kun et ole kiinnostunut erilaisten asioiden vaikutuksista toisiinsa. Jos haluat vastauksia kysymyksiin miksi, miten tai vaikuttaako jokin asia johonkin toiseen asiaan, niin silloin tarvitset datan tarkempaa analysointia. Ja siihen tarvitset hyvin todennäköisesti apua, mutta älä huoli, sitä on saatavilla!

2. Mitä haluat datalta? Mieti oletko kiinnostunut pelkästä ennustamisesta vai kenties myös selityksistä. Monet datan analysointimenetelmät eivät tarjoa mitään selityksiä itsessään, ne antavat vain pelkän lopputuloksen, esimerkiksi summan. Tämä lopputulos saattaa olla täysin riittävä, jos olet kiinnostunut esimerkiksi siitä, ostaako joku jonkin tuotteen. Jos lisäksi haluat tietää, että miksi tämä joku ostaa sen tuotteen, niin sinun on valittava tilastoanalyysi huolellisesti.

3. Data ei valehtele, vaan näyttää sen mitä sen tutkija osaa sieltä poimia. Näkemäsi luvut ovat totta, ja ilman historiaa ei ole tulevaisuutta.

4. Aloita analysoimaan saamasi dataa,

→ Tutkimalla niin, että tarkastat kaikkien muuttujien arvot yksittäisinä. Älä laske mitään riippuvuuksia muuttujien välille tai yritä mallintaa mitään, ennen kuin olet varmistunut siitä, että jokaisen muuttujan jokainen arvo on järkevä.

→  Tarkista erityisesti sellaiset kategoriset muuttujat, joilla on 3-N (N pienehkö) erilaista arvoa. Jos arvoluokassa ei ole tarpeeksi arvoja, voit yhdistää arvojoukkoja. Kategorista muuttujaa voi monesti käyttää myös ihan normaalina muuttujana, mutta silloin arvojoukon eri arvojen on oltava ”yhtä kaukana toisistaan” tai em. kaltainen tilanne on aikaansaatava.

→  Älä tee sellaista analyysiä, jonka toimintaa et ymmärrä. Mikään tilastoanalyysi ei ole yksinkertainen – jokaisen taustalla on pienempi tai isompi joukko oletuksia. Näiden oletusten on oltava voimassa analyysiä tehdessä. Joskus ne voidaan kiertää ja jopa unohtaa, mutta tekijän on kuitenkin ymmärrettävä, että ne ovat siellä taustalla ja otettava ne huomioon, tavalla tai toisella. Valitse mieluummin vähemmän vaikea tilastoanalyysi kuin sellainen, jonka toiminnasta et ole varma. Näin et saa epäselviä tuloksia, tai tuloksia, joita et välttämättä ymmärrä.

→  Suosittelen käyttämään tulosten tulkinnassa asiantuntijaa. Analyysien tulkinnat ovat monesti erittäin vaikeita ja niissä tehdään helposti isojakin virheitä.

→  Data paljastaa asioita, halusit tai et. Aina kannattaa kuitenkin tarkastella dataa, koska se voi paljastaa erittäinkin mielenkiintoisia asioita.

5. Käytä apunasi visualisoinnin keinoja. Jos et tarvitse varsinaista datan analysointia, niin datan hahmottamista helpottaa visualisoiminen. Siihen on tänä päivänä tarjolla erilaisia työkaluja, esimerkiksi Google Analytics antaa dataa ymmärrettävän näköisessä muodossa.

Nämä vinkit auttavat sinua hyödyntämään dataa tehokkaasti, oli kyseessä sitten yksinkertainen visuaalinen tarkastelu tai syvällinen tilastoanalyysi. Muista, että data on arvokasta vain, kun osaat hyödyntää sitä oikein!

Nämä vinkit tarjosi Tiedolla johtamisen edelläkävijä -hankkeen erikoistutkija Jari Kyngäs.

Jaa artikkeli

Lisää aiheesta

Lue myös