Olin töissä palaverissa, jossa sana tekoäly mainittiin niin monta kertaa että jossain vaiheessa alkoi tuntumaan siltä, että tästä voisi saada hauskan juomapelin. Joka kerta kun joku mainitsee tekoälyn palaverissa, pitäisi ottaa shotti. Työteho toki laskisi, mutta varmasti olisi usein paljon hauskempaa.
Tekoäly on määritelmällisesti laaja, ja siihen voidaan katsoa liittyvän asioita ihan perinteisestä koneoppimisesta (luokitellaan tai ennustetaan jotakin) siihen, että syötteen pohjalta syntyy videoita, musiikkia tai tekstiä.
Arkikeskustelussa tekoäly nähdään usein yhtenä, isona möhkäleenä. Syynä siihen lienee ehkä tieteiskirjallisuus, ehkä se että keskustelua muuten dominoi tekoäly-termin käyttö. Joskus pelkän tekoäly-termin käyttäminen on ihan ok, mutta sen ei saisi kuitenkaan johdattaa ihmisiä harhaan, esimerkiksi niin että kuvitellaan tekoälyn tarkoittavan vaikkapa jotain yksittäistä työkalua tai palvelua.
Tekoälyn erikoistumisen teoria on itse keksimäni teoria, jonka ajatus on siinä että mitä liiketoimintakriitisempää tai muuten merkityksellisempää tekoälyllä ollaan tekemässä, sen tärkeämmäksi tarkempi määrittely tulee. Eli jos kyse on asiasta, jonka voi laskea vaikka leikiksi tai huvitteluksi, tekoälyä voi kutsua laajalti melkein miksi vaan. Silloin voi käyttää mitä työkaluja haluaa, miten haluaa ja olla tyytyväinen. Kun mennään kriittisempiin juttuihin, tekoäly erikoistuu ja instrumentalisoituu työkaluksi, jonka tehtävä on ratkaista se ongelma joka halutaan ratkaista. Kriittisissä ratkaisuissa on ymmärrettävä miksi tekoäly tekee mitä tekee, millä datalla ja miten hyvin malli yleistyy suhteessa tunnettuihin havaintoihin.
Mietitään asiaa kahden erilaisen ongelman näkökulmasta. Kuvitellaan, että pankki haluaa käyttää tekoälyä lainahakemuksien karsimisessa sekä automaattisessa käsittelyssä. Emme me halua käyttää tähän kielimalleja tai ChatGPT:n kaltaisia chätbotteja, vaan tarvitsemme mallit jotka on asianmukaisesti koulutettu ja arvioitu. Saatamme vaatia jopa selitettävyyttä tai sellaisia malleja, jotka ovat tarpeeksi yksinkertaisia ymmärtää. Näitä malleja on esimerkiksi erilaiset regressiomallit ja vastaavat. Tässä ongelmassa hyödämme laajan määritelmän tekoälyä, mutta olemme eriyttäneet tarkasti sen mitä haluamme käyttää ja mihin, sekä vaadimme itseltämme myös mallien asianmukaista arviointia. Tarvitsemme myös omaa dataa ja sen ympärillä olevaa laskenta- ja tallennusinfrastruktuuria.
Toinen esimerkki on se, että haluan hyödyntää kuvia vaikkapa tässä blogipostauksessa. Voin käyttää siihen ChatGPT:tä ja pyytää sitä muodostamaan minulle kuvan, joka visualisoi vaikkapa esittämääni teoriaa. Se on leikkiä, se on hauskaa, siinä ei tarvitse ymmärtää miksi tai minkä aineiston pohjalta kuva on generoitu. Emme tarvitse tähän kuin luottokortin ja intoa.
Yhteenvetona: mitä tärkeämmästä asiasta on kyse, sen tärkeämpää on ymmärtää, mitata ja sanoittaa mitä tekoälyllä tarkoitetaan.