John Deweyn kirjassa Julkinen toiminta ja sen ongelmat (1927) väitetään, että ihmisten tieteellisen kiinnostuksen kohteet ovat aina lähteneet etäältä arkielämästä: tähtitiede kehittyi matematiikan avulla, ja sen tuloksia voitiin soveltaa fysiikkaan. Fysiikan sovellukset avasivat ovia kemiassa, joka sitten taas osaltaan mahdollisti biologian kehittymisen ja tutkimisen. Kun biologiaa ja fysiologiaa ymmärrettiin tarpeeksi, ihminen pystyi tutkimaan ja miettimään psykologiaa entistä paremmin. Tieteen historia kulki pitkän tien kaukaisista objekteista siihen mitä meidän sisällämme on.
Deweyn kirja on julkaistu noin sata vuotta sitten, joten kaikessa kehityksessä on tapahtunut edistystä. Tekoäly suurimpana murroksena on hyötynyt niin matematiikan, biologian kuin psykologian kuin fysiikan ja kemiankin kehitysaskeleista. Ne mallit, joilla kuvaamme aivoja ja ajattelua on fysiikasta syntyneiden materiaaliatekniikoiden sekä elektroniikan myötä siirrettävissä algoritmeina koneeseen, jotka sitten tarjoavat meille älykkään oloista tietoa ja käytöstä.
Tekoäly, vaikka se perustuukin tieteen ja teknologian melko pitkän aikavälin saavutuksiin, on kuitenkin monilta osin melko selittämätöntä. Vaikka pystymme luomaan neuroverkkoja, jotka oppivat generoimaan älykkään kuuloista tekstiä tai tunnistamana kuvia toisistaan, emme ymmärrä aivan täysin sitä miksi mallit toimivat niinkuin toimivat.
Olen itse kuulunut joitakin vuosi sitten siihen koulukuntaan, joka toivoo että käytetään helposti selitettäviä ja yksinkertaisia malleja. Toive onkin hyvä ja mieluinen, kun puhutaan vaikkapa luottoriskin arvioinnista tai jostain muusta sellaisesta, jossa voidaan käyttää helppoja koneoppimisen malleja, joiden parametreja ja syötettä voidaan säädellä ja arvioida saatuja arvoja näiden valossa.
Suuret generatiiviset mallit eli se mitä me kutsumme tekoälyksi on kuitenkin iso musta laatikko. Mallit toimivat datalla, jota emme tiedä, parametreillä joita emme tiedä, konesaleissa joista emme tiedä. Tai tiedämme sen, että siellä on GPU-laskentayksiköitä tosi paljon.
Tekoäly on monelle suuri mysteerio. Ihmisillä on kuitenkin ollut kautta aikain halu oppia ja ymmärtää ilmiöitä, joita eivät voi suoraan kontrolloida, kuten vaikka erilaisia fysiikan ilmiöitä. Keinot ja välineet fysiikan ilmiöiden ymmärtämiseen ja tarkasteluun annetaan jo lapsuudessa, peruskoulussa, kun tunneilla tehdään pieniä kokeita.
Kuitenkin, syystä tai toisesta, tekoälyn suhteen ihmiset vain aukaisevat suunsa ja ovat äimän käkenä miten upean älykästä hölynpölyä kone tuottikaan. Ja hei, kun käytettiin kauniita sanoja ja kohteliaita pyyntöjä niin vastaus oli pidempi. Piirretään käppyrää ja ihmetellään lisää. Tekoäly on tuonut ihmisten elämään ilmiön, jota ei täysin ymmärretä eikä myöskään täysin kyseenalaisteta vaan annetaan ohjata omaa tekemistä.
Koska tekoäly on osin tuntematon sekä käyttäjilleen että myös kehittäjilleen, on käsittämätöntä ja osin jopa kestämätöntä ihmisten itsensä sekä ihmiskunnan näkökulmasta, että malleja ei edes yritetä ymmärtää.
Tekoälymallien ymmärtämisessa on kolme tasoa: ensimmäinen taso on pyrkiä ymmärtämään kehitettyjä malleja, toinen taso on pyrkimys mallien oikeellisuuden arvioimiseen ja kolmas, selkeästi monimutkaisin taso on mallien selitettävyyden ymmärtäminen.
Kehitettyjen mallien ymmärtäminen voi olla kaukainen haave käytännön tekoälytouhuajalle, koska se on vahvasti matemaattista. Vaikka esimerkiksi transformer-arkkitehtuurit eivät perustukaan kovin monimutkaiseen matematiikkaan, arkkitehtuurit ovat kuitenkin isojen datavaatimuksien vuoksi hankalia purkaa pieniksi, ymmärrettäviksi paloiksi.
Mallien hyvyyden arvioinnissa sekä selitettävyydessä päästään kuitenkin siihen mikä meille ihmisille on usein melko tuttua ja helppoa. Koneoppimismallien hyvyyden tarkastelussa tavoitteena on arvioida miten hyvin jokin malli pystyy yleistämään tuloksia jollekin ennen näkemättömälle datalle: tyypillisesti tämä tehdään niin, että ensin malli koulutetaan osajoukolla dataa ja lopulla datalla arvioidaan osumatarkkuutta. Selitettävyydellä tarkoitetaan sitä, että pyritään löytämään vastauksia siihen miksi jokin malli päätyy tiettyyn vastaukseen jonkin toisen edestä. Yksinkertaisia menetelmiä tähän on esimerkiksi se, että kuvasta jätetään kohtia pois ja annetaan mallin tehdä ennuste puutteelliselle datalle.
Sekä mallien hyvyyden että selitettävyyden analysoiminen pohjaa ihmisille hyvin tuttuun empiiriseen tapaan tutkia ympäröiviä ilmiöitä. Empiiristä tutkimusta tehdään esimerkiksi fysiikassa, ja jokainen kouluja käynyt on varmasti joutunut mittaamaan tunnilla jonkin ilmiön suureita, pitämään havainnoista kirjaa ja lopulta laskemaan jonkin suureen saamiensa havaintojen perusteella.
Tekoälyn tuottamia ratkaisuja kannattaa ajatella oman aikamme empiirisenä todellisuuteena: me saamme tuloksia eli tekoälyn tuottamia vastauksia, ja meidän on löydettävä omasta todellisuudestamme ne keinot joilla voimme arvioida onko tekoälyn tuottama tulos sellainen kuin odotamme. Vaikka tekoälyn tekemä ennuste ei olekaan mikään omena, jonka kiihtyvyyden maapalloa kohtaan tiedämme olevan aina 9,81 m/s^2, meillä on kuitenkin olemassa tiettyjä todellisuuden pisteitä joihin voimme verrata tuotoksia: voimme verrata tuloksia tunnettuihin tosiseikkoihin, omiin havaintoihin maailmasta tai kokeilla empiirisesti miten hyvin ne toimivat.
Vaikka mallit ovat abstrakteja, niiden kanssa pitää muistaa että todellisuus ympärillämme on todellinen ja malleja voi käsitellä sekä tutkia kokeellisesti.