Toimittajat, robotit ja Turingin testi

Sen kunniaksi, että tietokoneohjelma on viimein selviytynyt Turingin testistä, julkaisen lyhennelmän Painokoneet seis! -kirjani (2011, Teos) luvusta Robotit, kuhnurit ja eliittijoukot. On nimittäin niin, että tietokone olisi voinut myös kirjoittaa aiheesta uutisen. Katkelman loppupuolella kerron Turingin testistä ja ennusteesta, jonka mukaan kirjoittava robotti vielä voittaa journalismin Pulitzer-palkinnon. (Kyseessä on luvun alku ja loppu, keskikohdan saatte lukea kirjasta.)

EDIT: Buzzfeed kyseenalaistaa uutisen, joka oli lähtöisin Readingin yliopistolta. Yliopisto näyttää itse suurennelleen asiaa aika tavalla, ja testin sääntöjä on eri tapauksissa tulkittu eri tavoin. Ei ole olemassa yhtä ainoaa Turingin testiä, joten Eugene-chatbot tavallaan läpäisi eräänlaisen Turingin testin – ukrainalaisen teinipojan teeskentely sujuu koneelta helpommin kuin englanninpuhujan. Tässä tekstissäni kerron kenties virallisimmasta Turingin testistä, Loebner-palkinnosta, joka järjestetään vuosittain.

BBC:n uutisessa Readingin yliopiston edustaja kommentoi jo heti aluksi näin:

“Some will claim that the Test has already been passed,” said Kevin Warwick, a visiting professor at the University of Reading and deputy vice-chancellor for research at Coventry University.

“The words Turing test have been applied to similar competitions around the world. However, this event involved the most simultaneous comparison tests than ever before, was independently verified and, crucially, the conversations were unrestricted.”

EDIT2: Arvelen, että joko yliopistossa ei ymmärretty, miten suuria otsikoita aiheesta laaditaan – tai sitten juuri mediahuomio oli tavoitteena. Omassa tekstissänikin mainitun Ray Kurzweilin kritiikki täällä.

No, toimittajan hommissa tietokoneohjelmat ovat joka tapauksessa jo aika päteviä:

Robotit, kuhnurit ja eliittijoukot

Tunnetun teoreeman mukaan ääretön määrä apinoita voi saada aikaan Shakespearen kootut teokset, jos niille annetaan ääretön määrä kirjoituskoneita ja äärettömästi aikaa. Todennäköisyys on pieni, mutta ei olematon.

Apina on tässä ajatusleikissä metafora laitteelle, joka tuottaa satunnaisia kirjainjonoja loputtomasti.

Mutta entä kun apinan voi opettaa tuottamaan järkeviä kirjainjonoja eli sanoja ja lauseita? Stats Monkey, Tilastoapina, ei kirjoita Shakespearea, mutta urheilujournalismia se tuottaa ihan sujuvasti.

Yhdysvaltalaisen Northwesternin yliopiston Intelligent Information -laboratorion vuonna 2009 kehittämä Stats Monkey on ohjelma, joka kirjoittaa täysin päteviä lehtijuttuja alle kahdessa sekunnissa. Apinan teksti voittaa ihmisjournalistin monessa mielessä: se ei tee kielioppi- tai asiavirheitä, ei jaarittele eikä varsinkaan hidastele.

Aluksi Apina keskittyi amerikkalaisen baseballin raportointiin, mutta laajensi pian osaamistaan muihin urheilulajeihin. Nykyään se hallitsee suvereenisti myös jalkapallon ja koripallon. Kehittäjät uskovat Apinan korvaavan urheilutoimittajan lisäksi myös taloustoimittajan, ainakin pörssitiedotteiden laatijana. Apina osaa jo nyt kirjoittaa esimerkiksi kiinteistökaupasta, liikenteestä sekä avoimista työ- ja opiskelupaikoista.

”Nykyään kutsumme ohjelmaa nimellä Authoring Engine”, kertoo Kristian Hammond. Hän toimi Northwesternin yliopiston projektin toisena johtajana ja vetää nyt firmaa nimeltä Narrative Science. Yhtiö on lisensoinut projektin ja kauppaa nyt Tilastoapinaa uutisorganisaatioille. Nimenvaihto johtunee siitä, että sanomalehdet pelkäävät Tilastoapina-nimisen konekirjoittajan palkkaamisesta koituvia imagohaittoja.

Hammondin mukaan Narrative Sciencella on asiakkainaan ”puoli tusinaa” uutisorganisaatiota, jotka käyttävät ohjelmaa uutistuotannossaan. Hän ei halua nimetä asiakkaita, sillä ”kaikki eivät vielä halua paljastaa, että tuotamme heille juttuja”. Big Ten Network, amerikkalaisten yliopistojen urheilusarjoihin keskittynyt uutisväline, on ainoa, joka kehtaa myöntää palkanneensa koneen reportteriksi. Juttujen perässä tosin todetaan vain kainosti ”powered by Narrative Science”.

Lukijoiden kannalta näyttäisi olevan ihan sama, antaako uutisväline Apinalle kunnian jutusta vai ei. He eivät nimittäin huomaa eroa. Hammondin mukaan kukaan ei ole toistaiseksi erottanut Stats Monkeyn tekstiä ihmisen laatimasta.

”Saamme asiakkailtamme kommentteja sananvalinnoista, kertojanäänestä ja rakenteesta, mutta kukaan ei ole koskaan valittanut, että jutut kuulostavat koneen kirjoittamilta. Päinvastoin, joudumme usein työskentelemään uutispäälliköiden kanssa, jotka edelleen haluavat uskoa tekstin olevan ihmisen kirjoittamaa.”

Stats Monkey kaivaa tietoa kahdenlaisista lähteistä. Ensin se analysoi pelin tilastoja, kuten voitto- ja pistetaulukoita. Näin se saa tietää, kumpi joukkue oli ennakkosuosikki ja kumpi altavastaaja. Se löytää myös matsin tärkeimmän pelaajan ja kaivaa tämän mahdolliset haastattelulausunnot verkosta. Ohjelma osaa myös otsikoida ja lisätä juttuun pelaajan naaman, jos kuva löytyy netistä.

Toisekseen ohjelmalla on käytössään sanavarasto pullollaan urheilutoimittajien yleisesti käyttämiä substantiiveja, verbejä ja fraaseja. Rumasti sanottuna kyseessä on kliseepankki, josta ohjelma päätöspuun avulla valitsee sopivimmat kaavat jutun kertomiseen.

Stats Monkeyn nopeus riippuu juttutyypistä ja saatavilla olevan datan monipuolisuudesta. Vähimmillään Apinalta kuluu valmiin jutun kirjoittamiseen puoli sekuntia, enimmillään viisitoista.

”Kehitämme ohjelmaa koko ajan. Haluamme parantaa sen analyyttisiä kykyjä ja ilmaisuvoimaa”, Hammond sanoo.

”Jos datassa on tarina, jonka ihminen pystyy löytämään, me pystymme muokkaamaan ohjelmaa niin, että se löytää sen.”

Stats Monkeyn toiminta on juuri niin rajallista kuin sille syötetty data. ”Mitä parempaa tietoa ohjelma saa, sitä paremman jutun se kirjoittaa. Tilastotieto, joka tarjoaa myös kattavasti vaihteluja ja historiaa, antaa ohjelmalle parhaat mahdollisuudet lisätä juttuun kontekstia.”

Kontekstia? Eikö juuri siinä pitänyt olla ihmisen osa? Riippuu siitä, mitä kontekstilla tarkoitetaan. Tilastoapina tajuaa tilastojen perusteella, että liigan häntäjoukkueen voitossa on jotakin tavallisesta poikkeavaa. Se ei kuitenkaan näe pelaajien ilmeitä eikä kuule yleisön innostusta.

Hammond ei halua Apinansa korvaavan ammattitoimittajaa. Hän muistuttaa, että kaikista urheilutapahtumista vain murto-osasta kerrotaan mediassa. Apina voi hoitaa jutut, joihin ihmisen työaika on liian kallista. Koneen voi valjastaa palvelemaan pienten yleisöjen lajien ystäviä tai vaikka nappulaliigalaisten vanhempia.

Itse asiassa Tilastoapinan kehittäjät kaavailevat ohjelmastaan toimittajien ammattikunnan pelastajaa. Ihmistoimittajien aika vapautuu tärkeämpiin hommiin, kuten tutkivaan journalismiin ja muuhun aikaa ja ajatuskapasiteettia kuluttavaan. Kone hoitakoon pallopelit ja pörssitiedotteet.

Japanissa on jo kehitetty liikkuva robottitoimittaja, joka on käytännössä segway-laitteeseen kiinnitetty videokamera. Mikä jottei! Robotoimittaja voisi rullailla kaduilla tekemässä katugallupit. Näin kesätoimittajat ja pätkätyöläiset vapautuisivat olennaisempiin tehtäviin.

Voisiko robotti vapauttaa toimittajat muustakin toisteisesta työstä? Annetaan koneen arpoa vaihtuva näkökulma jokavuotiselle juhannuksen krapulajutulle, alennusmyynneille, keväisille koirankakoille ja jouluvalmisteluille. Ihmistoimittajat saavat aikaa ajatella ja keksiä omaperäisiä juttuideoita. Kenties he alkavat taas tehdä tutkivaa journalismia ja ajatustyötä vaativia analyyseja.

Tai sitten mediakonsernin johto tajuaa, että se voi hankkiutua eroon taas muutamasta kalliista ihmisestä, kun perushommat hoituvat Apinan voimin. Tuskin moni uutispäällikkö lähettää ihmistä paikalliseen pesäpallomatsiin kyselemään yleisön ja pelaajien tunnelmia, kun robotti hoitaa perusuutisen. Konetoimittajan säästämien rahojen toivoisi menevän laatujournalismiin, mutta en taida lyödä sen puolesta vetoa.

 

Kysynnän ja tarjonnan lait

Stats Monkey ei ole suinkaan ainoa lajityyppinsä edustaja. Maailman suurin uutistoimisto Thomson Reuters on jo vuosien ajan kokeillut erilaisia koneluettavia uutispalveluita. Reutersin NewsScope palvelee pörssissä toimivia yrityksiä, jotka tekevät voittonsa automatisoidulla osakekaupalla. Algoritmeihin perustuva, reaaliaikainen kaupankäynti on jo merkittävä osa osakekauppaa, ja sen osuus kasvaa koko ajan. Ihmisen rooli sekä tiedon välittäjänä että päätösten tekijänä on puristettu minimiin.

NewsScope tehtailee tulostiedotteista uutisen alle puolessa sekunnissa. Se käyttää Reutersin mittavaa tietokantaa selvittääkseen, miten hyvin tai huonosti firma on pärjännyt.

NewsScopen algoritmit seulovat uutisista ”mielialoja” tai ”tunnelmia” (sentiments) ja pisteyttävät niitä sisältäviä sanoja. Järjestelmä määrittää millisekunneissa, millainen mieliala vallitsee tietyn yhtiön ympärillä.

Reutersin suurimmat tulovirrat eivät enää aikoihin ole tulleet perinteisestä uutistoiminnasta, vaan taloustiedon kauppaamisesta finanssimaailman päättäjille. Taloustiedon pitää nykyisin olla niin nopeaa, ettei ihmistaloustoimittaja siihen pysty. Ihminen ei armottomassa hitaudessaan kelpaa edes oikolukijaksi.

Kun konetoimittaja voittaa Pulitzerin

Brittiläinen matemaatikko ja filosofi Alan Turing oli toisen maailmansodan aikaan yksi saksalaisten Enigma-koodin murtajista. Häntä voidaan pitää myös algoritmi-käsitteen isänä, mutta parhaiten hänet tunnetaan Turingin testin keksijänä.

Vuonna 1950 Turing julkaisi tutkielman koneiden älykkyydestä. Turingin idean mukaan koneiden ajattelukykyä voidaan testata järjestämällä ”imitaatiopeli”, jossa kuulustelija eli C haastattelee kahta pelaajaa, jotka ovat A ja B. Näistä toinen on ihminen, toinen kone. C:n tehtävänä on päätellä, kumpi on kumpi.

Ensimmäinen vuosittainen Turingin testi järjestettiin Bostonissa vuonna 1991. Sen nimi on Loebner-kilpailu, yhdysvaltalaisen keksijän Hugh Loebnerin mukaan. Testi on tarkoitus järjestää joka vuosi niin kauan, kunnes keinoäly voittaa ihmisälyn. Joka vuosi menestyksekkäin kone ja sen ohjelmoija palkitaan Inhimillisin Tietokone -arvonimellä. Samoin joka vuosi yksi ihmisverrokeista saa Inhimillisin Ihminen -palkinnon.

Alan Turingin oman ennusteen mukaan tietokoneen voisi opettaa vuoteen 2000 mennessä niin hyväksi imitaattoriksi, että se pystyy petkuttamaan 30 prosenttia kuulustelijoista. Ennustus melkein toteutui vuonna 2008, kun yksi peliin osallistuneista keskusteluohjelmista onnistui huijaamaan neljäsosan 12-jäsenisestä tuomaristosta. Se jäi vain yhden äänen päähän 30 prosentista.

Seuraavana vuonna Brian Christian – runoilija, jolla on tutkinto sekä tietojenkäsittelytieteistä että filosofiasta – lensi Yhdysvaltain Seattlesta Britannian Brightoniin osallistuakseen Turingin testiin. Hänen tavoitteenaan oli vuoden Inhimillisin Ihminen -tunnustus. Hän tutki koneälyä kuukausitolkulla ennen testiä ymmärtääkseen, miten voisi parhaiten vakuuttaa ihmistuomarin omasta ihmisyydestään. Onnistuneen Turingin testin tuloksena Christian sai himoitsemansa palkinnon ja tuli samalla kirjoittaneeksi aiheesta kirjan. The Most Human Human: Defence of Humanity in the Age of the Computer ilmestyi keväällä 2011.

Brian Christian ymmärsi, että koneet eivät voita imitaatiopeliä yhä useammin vain siksi, että tietotekniikka kehittyy. Syynä on myös se, että me ihmiset taannumme. Wikipedian, älypuhelinten ja ennustavan tekstinsyötön kyllästämä sukupolvi ei enää erota yksilöä kasvottomien kollektiivien seasta. Ryhmätyössä on voimaa, mutta ainoastaan yksilö voittaa juttelurobotin (chatbot) Turingin testissä.

Turing-tuomarin on uskottava, että verhon takana on ainutkertainen ihminen, persoona. Esimerkiksi Cleverbot-ohjelma käyttää crowdsourcingia eli joukkoistamista rakentaakseen itselleen koherentin ”persoonallisuuden”, mutta kun siltä kysyy sen asuinpaikasta, se höpisee tuhansilla äänillä tuhansista paikoista, jotka sen koodiin on syötetty.

 

Moni uskoo, että peli on hävitty lopullisesti siinä vaiheessa, kun tietokone voittaa Turingin testin. Futuristi Ray Kurzweil on ennustanut, että tämä tapahtuu vuoteen 2029 mennessä.

Narrative Sciencen Kristian Hammond menee pitemmälle. ”Kone voittaa vielä journalismin Pulitzer-palkinnon. Siihen ei kulu 30 vuotta, vaan pikemminkin viisi vuotta. Ja sen voittaa jokin, minkä me rakennamme.”

Hammondin ennuste voi kuulostaa pelottavalta, mutta kenties robotoimittajat ja tilastoapinat todella vielä koituvat journalistien pelastukseksi. Annetaan vain algoritmien ja robottien tehdä liukuhihnahommat, jos oikeat toimittajat vapautetaan samalla ajatustyöhön, johon algoritmi ei pysty.

Brian Christianin mukaan koneet häviävät lopulta aina ihmiselle, kekseliäimmälle lajille päällä maan. Me emme jää kanveesiin makaamaan, kun Turingin testin tyrmäys lopulta tulee. Seuraavan vuoden kilpailuun me sparraamme itsemme kuntohuippuun. Meistä tulee inhimillisempiä kuin koskaan ennen. Christianin sanoin meistä tulee ”parempia ystäviä, taiteilijoita, opettajia, vanhempia ja rakastajia.”

Teknologian hypernopean kehityksen luulisi pakottavan toimittajat etsimään alueita, joissa he peittoavat algoritmit ja koneälyn mennen tullen. Verkottuneen yhteiskunnan uudet journalistit tarvitsevat yhä enemmän tietokantojen analysointitaitoja, mutta toisaalta myös tunteiden ja monimutkaisten asiayhteyksien välittäminen jää yhä ihmistoimittajien tehtäväksi.

Robotti ei kirjoita henkilökuvaa New Yorkeriin eikä arvostele romaania tai kuvataidenäyttelyä. Se ei osaa innostua eikä surra. Robotilla ei ole mielipiteitä. Se ei tiedä, miltä jokin maistuu, haisee, kuulostaa tai tuntuu. Se ei kärsi maailmatuskasta eikä pelkää kuolemaa. Se ei voi tietää, millaista on olla ihminen.

Ainakaan toistaiseksi.

About Johanna Vehkoo

Journo, speaker, fact-checker. Formerly Visiting Scholar at Wilson Center, Washington DC, and Fellow at the Reuters Institute for the Study of Journalism, Oxford University. Wrote a book about the future of quality journalism. Founder of award-winning startup Long Play. Blogs in both Finnish and English.
This entry was posted in Journalism, Journalismin tulevaisuus, Painokoneet seis!. Bookmark the permalink.

3 Responses to Toimittajat, robotit ja Turingin testi

  1. Aleksi says:

    Johanna, kannattaa tutustua Kurzweilin omaan näkemykseen Turingin testin läpäisystä, ja tästä viimeisimmästä “kohuläpäisystä”! http://www.kurzweilai.net/response-by-ray-kurzweil-to-the-announcement-of-chatbot-eugene-goostman-passing-the-turing-test

    • “Professor Warwick claims that the test was “unrestricted.” However, having the chatbot claim to be a 13-year-old child, and one for whom English is not a first language, is effectively a restriction. Moreover, the interactions were reportedly limited to five minutes each. There is a high likelihood of fooling naïve judges in such a brief period of time.

      I chatted with the chatbot Eugene Goostman, and was not impressed. Eugene does not keep track of the conversation, repeats himself word for word, and often responds with typical chatbot non sequiturs. Here is the transcript.”

      Jep, nämä pointit on esitetty monessa kritiikissä, ja olen kyllä ihan samaa mieltä. Jännä veto kyseiseltä professorilta ja yliopistolta. Uutinen meni läpi harvinaisen laajalti – kenties sitä juuri olivat hakemassa?

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s