Tekoälymallien ekonomia

Ohjelmistotuotteisiin liittyy omanlaisia taloudellisia perusasioita. Eräs tärkeimmistä periaatteista ohjelmistotuotteissa on verkostovaikutus. Verkostovaikutus voidaan jakaa kahteen alakategoriaan, suoraan ja epäsuoraan. Suorat verkostovaikutukset tarkoittavat sitä, että mitä enemmän samalle teknologialle tai standardille tulee käyttäjiä sen hyödyllisempää sen käyttäminen on. Esimerkkinä tästä voidaan ajatella vaikkapa sosiaalisen median palveluita, jotka riippuvat täysin siitä miten paljon siellä on käyttäjiä. Epäsuorat verkostovaikutukset tarkoittavat sitä, että ohjelmistotuotteen hyöty syntyy siitä miten paljon täydentäviä palveluita ja tuotteita ohjelmistotuotteen ympärille syntyy. Tästä erinomaisia esimerkkejä on vaikkapa korporaatioille myytävät ohjelmistot, joiden käyttöönottoon löytyy konsulttikumppaneita tai vaikkapa ihan tavalliset käyttöjärjestelmät, jotka olisivat ilman apuohjelmia lähes hyödyttömiä. Verkostovaikutukseen liittyy läheisesti se, että vahvat vahvistuvat ja heikot heikentyvät.

Tekoälymallien kouluttaminen hyötyy erittäin paljon verkostovaikutuksesta. Kerrataan tässä vaiheessa vielä se, miten tekoälymalleja koulutetaan: on olemassa jokin tekoälymalli, jonka tehtävänä on ratkaista annettu tehtävä. Kun puhumme tekoälystä, tarkoitamme usein laajoja kielimalleja, joten meidän tehtävämme on nyt se että haluamme tuottaa tekstiä vastauksena jollekin annetulle syötteelle. Tekoälyalgoritmit ei itsestään tarjoa tähän mitään konstia, vaan algoritmin on saatava huomattava määrä aineistoa, jolla malli ensin koulutetaan ja sen jälkeen testataan. Testaamisen tarkoituksena on arvioida miten lähellä oikeaa mallin tuottama lopputulos on. Joissakin tehtävissä ja aineistoissa mallien kouluttaminen ja arvioiminen on helppoa, jos saatavilla on hyvää dataa mutta näin ei aina ole.

Suurien kielimallien hyödyllisyys rakentuu sen varaan, että niitä käyttää paljon ihmisiä ja ihmiset antavat malleille palautetta. Ensimmäiset suuret kielimallit (tai niiden käyttöliittymät) eivät antaneet mahdollisuutta arvioida saatua syötettä, mutta nykyisin esimerkiksi ChatGPT:ssä on mahdollisuus peukuttaa mallin antamia vastauksia tai valita kahden vastauksen välillä. Ihmisen antama vastaus, joko mallin kouluttajien tai käyttäjien puolelta, on vahvistusoppimista ihmispalautteesta (reinforcement learning from human feedback (RLHF).

Jos tekoälyä tarkastellaan verkostovaikutuksen näkökulmasta, tekoäly muuttuvat sitä hyödyllisemmiksi eli älykkäämmiksi sen perusteella miten paljon se saa palautetta käyttäjiltä, jolloin useampi ihminen pitää palveluita hyödyllisenä ja palveluille tulee lisää käyttäjiä jotka edelleen kehittävät palvelua paremmaksi. Tätä kutsutaan dataverkostovaikutukseksi.

Vaikka verkostovaikutusta kuvataan usein vaikkapa laajojen ohjelmistojen tai tuotteiden näkökulmasta, ne ovat oleellisia myös pienemmässä skaalassa: jos vaikkapa organisaatiolla on integraatiotarpeita eri järjestelmien välillä, yhtenäinen arkkitehtuuri ja teknologiavalinta vähentää pitkällä aikavälillä työn yksikkökustannusta.

Tekoälyn älykkyyden riippuvuus verkostovaikutuksesta kannattaa ottaa huomioon kun malleja kehitetään: mallien tuottaman syötteen jatkuva arviointi käyttäjiltä tulevan palautteen perusteella on kriittistä siinä missä datan laatuunkin panostaminen. Koska tekoälyjärjestelmien toimivuus ja myös tekoälyä tuottavien yritysten kasvu riippuu käyttäjien palautteesta sekä datasta, on syytä ottaa huomioon että se data kerätään jostain. Hyödyllinen, yritysten ja mallien kasvua tukeva data ei kasva missään perunapellossa vaan se on juuri sitä dataa mitä sinä ja sinun organisaatiosi tuotatte ja minkä toimittajat haluavat käyttöön.

Jos siis verkostovaikutuksen ansiosta organisaatiosi hyötyy edullisimmista IT:n kehityskustannuksista, sormen antaminen tekoälyfirmoille kasvattaa heidän kättään ja auttaa heitä luomaan parempia tuotteita joilla voi tehdä paremmin tuottoa. Sinäkin voit hyötyä siitä, mutta todennäköisemmin isoimmat hyötyjät ovat tekoälymalleja tuottavat firmat.