Suomen tyypillisin tarina

Osallistuin maanantaina 23.5. Helsingin Sanomien järjestämään avoimen datan leikki- ja askartelupäivään. Historian toisessa HS Openissa oli leppoisa tunnelma, kun koodarit, toimittajat ja graafikot jaettiin työryhmiin kaivelemaan poliittista ja kulttuuriaiheista dataa.

Toimittajan homma tällaisessa yhteistyössä on ihan siellä ydinosaamisalueella: kysyä hyviä/tyhmiä/kekseliäitä kysymyksiä. Oma ideani oli etsiä Suomen tyypillisin kaunokirjallinen teos ja visualisoida se (harmi vain, ettei kukaan graafikko ehtinyt tarttua tähän). Tietokantavelho Eetu Mäkelä haki Kirjasampo-datasta vastaukset kysymyksiini. Saimme selville seuraavaa:

Suomen tyypillisin tarina kertoo arkielämästä, ihmissuhteista tai rakkaudesta. Se sijoittuu maaseudulle, mutta mystisesti myös Helsinkiin. Sen henkilöt ovat todennäköisemmin naisia, mutta kun heitä määritellään tarkemmin, he ovat kirjailijoita, sotilaita tai äitejä.
Teos sijoittuu sota-aikaan 1940-luvulle. Sen päähenkilöt ovat todennäköisimmin nimeltään Adolf Hitler, Viivi, Wagner, Jeesus, Kustaa III, Väinämöinen… Tässä kohtaa huomaamme, että datassa on hienoisia ongelmia. Ensimmäinen normaali etunimi on Riitta, mutta se jää jopa Kapteeni Kuolion taakse.

Perussuomalaisimman kirjailijan nimi on Matti Virtanen. Hän on syntynyt Helsingissä vuonna 1958. Kirjan nimi voidaan muodostaa otsikoissa yleisimmin esiintyvistä sanoista. Se voisi olla esimerkiki Miehen ja pojan elämä ja kuolema.

Tässä yleisimmät kirjojen nimissä esiintyvät sanat: (77) vain, (78) tarinoita, (78) teokset, (79) kolme, (83) ensimmäinen, (83) kertomuksia, (83) punainen, (84) maailman, (85) 1, (86) maan, (88) niin, (90) miehen, (90) runot, (91) 2, (92) laulu, (92) musta, (92) yö, (93) tie, (95) :, (97) pieni, (98) eli, (98) runoja, (101) joka, (101) kaikki, (103) vanha, (107) aika, (110) valitut, (113) oli, (113) rakkaus, (118) tyttö, (121) minä, (124) elämä, (128) kaksi, (129) -, (131) nainen, (136) maa, (147) tarina, (150) päivä, (153) kuin, (153) viimeinen, (155) se, (171) kuolema, (173) poika, (195) kun, (199) elämän, (255) muita, (281) mies, (293) ei, (505) on, (2285) ja.

About Johanna Vehkoo

Journo, speaker, fact-checker. Formerly Visiting Scholar at Wilson Center, Washington DC, and Fellow at the Reuters Institute for the Study of Journalism, Oxford University. Wrote a book about the future of quality journalism. Founder of award-winning startup Long Play. Blogs in both Finnish and English.
This entry was posted in Data journalism, Journalism, Suomi Finland Perkele. Bookmark the permalink.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s