Viite julkaisee vaalilehtensä sisällön blogiteksteinä. Koko lehti on luettavissa Issuussa.

Politiikka koostuu kahdesta asiasta: arvoista, eli siitä minkälaiseen yhteiskuntaan pyritään, sekä keinoista, joilla päästään kohti arvojen mukaista yhteiskuntaa. Voidaan esimerkiksi ajatella, että yhteiskunnan tehtävä on maksimoida heikoimmassa asemassa olevan kansanosan hyvinvointi (arvot) ja sen jälkeen miettiä, minkälaisin toimenpitein heidän hyvinvointiaan parannetaan (keinot).

Keinojen vaikutuksista on usein saatavilla tieteellistä tietoa. Poliitikon velvollisuus on selvittää, mitä keinojen vaikutuksista ja sivuvaikutuksista tiedetään.  Jos jostakin kysymyksestä (kuten ilmastonmuutoksesta ja sen syistä) vallitsee tiedeyhteisössä laaja yhteisymmärrys,  poliitikon tulisi luottaa siihen.

Tieteellisen tutkimustiedon tuloksia julkaistaan vertaisarvioiduilla foorumeilla sekä yhteiskunnallisen päätöksenteon tueksi julkaistavissa sektoritutkimuslaitosten raporteissa. Jotta tieteellistä tietoa voi hyödyntää, sitä pitää osata tulkita.

Tutkimuksiin liittyy aina epävarmuutta, joka voi johtua monesta tekijästä. Tutkimusta ei aina esimerkiksi pysty järjestämään niin, että vain testattava asia muuttuu koehenkilöiden välillä. Taannoin kohistiin Gardasil-nimisestä HPV-rokotteesta, jonka väitettiin testeissä aiheuttaneen 44 koehenkilön kuoleman. Tarkempi tarkastelu kuitenkin osoitti, että kuolemat eivät johtuneet rokotteesta:  Gardasilia saaneiden ja lumerokotetta saaneiden kuolleisuudessa ei ollut tilastollisesti merkitsevää eroa.

Joskus taas asioiden välillä voidaan havaita korrelaatio, mutta niiden välillä ei silti ole syy-seuraussuhdetta. Esimerkiksi vuosina 1998-2007 luomuruoan myynti ja autismidiagnoosien määrä korreloivat vahvasti. Luomuruoan vaarallisuutta todennäköisempi syy on kuitenkin puhdas sattuma, kun samaan aikaan on osunut luomuruoan suosion lisääntyminen ja autismikirjon ominaisuuksien laajempi diagnosoiminen.

Näyttökuva 2015-04-08 kello 8.52.06
Syy-seuraussuhde saatetaan myös tulkita väärin päin. Joskus uutisoitiin, että shakkia pelaavat vanhukset ovat muita paremmassa kunnossa. Syy ei luultavasti ainakaan täysin ole shakin pelaamisen hyödyllisyys.  Shakin tasoiseen kognitiiviseen toimintaan pystyvät vanhukset ovat yksinkertaisesti ikäisiään parempikuntoisia jo lähtökohtaisesti.

Omanlaisensa ongelma syntyy, kun tutkitaan ihmisten vapaavalintaista käyttäytymistä. Jos jonkun tekijän suhteen havaitaan korrelaatio esim. elinajan odotteeseen, korrelaation saattaa selittää tunnistamaton taustatekijä joka korreloi sekä havaitun tekijän että elinajan odotteen suhteen. Esimerkiksi jäätelön menekki ja hukkumiskuolemien määrä korreloivat, mutta korrelaation selittäjä on lämmin sää eikä niiden keskinäinen syy-seuraussuhde.

Luotettavimpia tuloksia yhteiskunnallista päätöksentekoa varten saadaan kenttäkokeilla, joissa osallistujat arvotaan koeryhmiin asuinpaikasta, iästä ja muista taustatekijöistä riippumattomasti. Näin voitaisiin saada tietoa esimerkiksi siitä, mitä sosiaaliturvan yksinkertaistaminen perustulon avulla voisi vaikuttaa ihmisten työllistymiseen ja oman elämänsä hallintaan.

Tiedon avoimuus lisää läpinäkyvyyttä ja luotettavuutta

Jotta tuotetut tutkimukset olisivat hyödyllisiä, niitä pitää myös oikeasti lukea. Nykyään raportit kuitenkin jäävät valitettavan usein hyllyn täytteeksi. Esimerkiksi Maailmanpankin tuoreen tutkimuksen mukaan kolmasosaa heidän julkaisemistaan raporteista ei ollut ladattu kertaakaan.

Tutkimustiedon saavutettavuutta ja läpinäkyvyyttä voidaan parantaa tekemällä tiedosta avointa. Avoimella tiedolla tarkoitetaan kaikkien käytössä olevaa avointa dataa ja lähdekoodia sekä julkaisuja. Pyrkimyksenä on, että kuka tahansa voi toistaa tutkimukset datan keruusta aina johtopäätöksiin asti. Näin tiedon luotettavuus paranee. Avoin tieto mahdollistaa sen, että entistä suurempi määrä ihmisiä osallistuu tiedon tuottamiseen ja hyödyntämiseen, myös sellaiset ihmiset, jotka eivät tee tutkimusta työkseen.

Yhteiskunnallisessa päätöksenteossa raportit, joiden perusteet eivät ole saatavilla, pakottavat kansalaiset ja poliitikot luottamaan virkamiesten tai kolmansien tahojen analyysin perusteisiin.

Suljetuissa analyyseissa virheen mahdollisuus on suurempi, koska tiedon käyttäjät eivät pysty varmentamaan tiedon perusteita.  Esimerkiksi Työ- ja elinkeinoministeriö salasi taannoin Energiankäytön tulevaisuus -raportin pohjana olleen Excel-mallin perusteet.

Viime vuosina paljon kohua on herättänyt bruttokansantuotteen ja julkisten menojen välisen suhteen riskiraja, joka on ollut yleisesti käytössä. Riskirajan on osoitettu johtuneen datan virheellisestä analyysistä. Jos analyysin aineisto olisi ollut yleisesti saatavilla, virhe olisi huomattu jo paljon aikaisemmin.

Avointa tietoa voi jatkojalostaa liittämällä siihen uusia datalähteitä. Vapaaehtoisvoimin tehty Louhos.github.io on paketoinut suomalaisia avoimia datalähteitä helposti hyödynnettäväksi kokoelmaksi. Sen avulla voi esimerkiksi visualisoida ja esittää monimutkaisiakin tuloksia helposti omaksuttavassa muodossa, vaikkapa käyttäen erilaisia karttasovelluksia.

Suomen tilanne on siinä mielessä hyvä, että tieteellistä tietoa päätöksentekoa varten  on olemassa. Sitä on kuitenkin usein vaikea kaivaa esiin, ja sen tulkinta vaatii ammattitaitoa.  Siksi sen hyödyntäminen on tällä hetkellä suhteellisen vajavaista. Tilannetta on kuitenkin helppo parantaa.

 

Jaakko Särelä

Kirjoittaja on tekniikan tohtori tilastollisen tietojenkäsittelyn ja koneoppimisen alalta. Hän työskentelee data-analyytikkona Reaktor Innovations Oy:llä.