Älykkyys, ihmismäisyys vai asiantuntijuus?

Tekoälyn filosofiaan on kautta aikain kuulunut pohdinta siitä, että milloin kone on älykäs ja milloin ei. Tunnetuimmassa eli Turingin testissä henkilö kommunikoi kahden toisen kanssa: toinen on kone ja toinen ihminen ja henkilön on tunnistettava kumpi on kone. Kiinalaisen huoneen argumentti on John Searlen argumentti tietokoneen varsinaista älykkyyttä vastaan, jossa kiinaa osaamaton ihminen suljetaan huoneeseen ja hänelle annetaan opaskirja jonka avulla hän pystyisi vastaamaan kiinankielisiin viesteihin, joita ulkopuolella oleva henkilö hänelle antaa. Argumentin mukaan konekin voi ulkopäin katsottuna älykäs, vaikka ei ymmärtäisi itse asiasta mitään vaan noudattaisi vain ohjeita.

Suuret kielimallit ovat antaneet jo vaikutelman siitä, että kone voisi olla älykäs. ChatGPT:ltä kysyttyyn kysymykseen saa usein ihan hyviä vastauksia ja tulee olo, etä nyt ollaan älykkyyden äärellä vaikka nopeasti voikin huomata että vastaukset ovat hyvin samankaltaisia kysymyksestä riippumatta – eivät sisällöllisesti, mutta tietyiltä elementeiltään. Joissakin vastauksissa saattaa olla myös epätarkkuuksia tai selkeitä virheitä ja parhaiten pärjätään sellaisten kysymyksien kanssa, joihin liittyy paljon olemassa olevaa sisältöä eli opetusaineistoa. Käytännössä tämän huomaa kun kysyy vaikkapa vaikean ja helpon ohjelmointiin liittyvän kysymyksen: jos kysymys on melko triviaali, voidaan helposti huomata että vastaus on usein myös melko hyvä, kun taas vaikeammissa tai marginaalisemmissa kysymyksissä ns. hallusinaatiota voi olla enemmän.

Suhtaudun itse suuriin kielimalleihin ennustemalleina, joita ne ovat, mutta joista voi löytyä apua erilaisiin ongelmiin mitä on. Vähän kuin Googlettaminen: haet tietoa ja jalostat sitä eteenpäin. Kielimallien kanssa pureskelu on osittain tehty jo puolestasi: malli on siis eräänlainen apuri, jota voi hyödyntää.

Tekoälyn asiantuntijuus on sellainen, jota Turingin testi tai kiinalaisen huoneen argumentti eivät oikein käsittele. Milloin voisin kutsua tekoälyä asiantuntijaksi? Mitä on asiantuntijuus?

Törmäsiin artikkeliin, joka käsitteli uudella kulmalla ilmastonmuutosta. Menemättä artikkelin sisältöön sen enempää, kerrottakoon että siinä oli uusi tulokulma mutta selkeästi vain yksi näkökulma. Halusin ChatGPT:ltä kommenttia mitä artikkeli jättää käsittelemättä ja annoin syötteenä artikkelin ja kysymyksen siitä, että mitä artikkelissa ei käsitelty, perustuen artikkeliin ja mallin tietoon ilmastonmuutoksesta. ChatGPT kyllä osasi vastata, mutta vastauksessa näkyi raja itse artikkelin sekä mallin tietojen välillä.

Mikä olisi sellainen testi, jolla voisi testata onko kielimalli riittävän hyvä asiantuntija jollain alalla? Olisiko se sellainen, että uuden syötetyn tiedon valossa se pystyisi luomaan jotain uutta näkökulmaa? Tai jos mallille syöttäisi uuden ohjelmistotuotteen dokumentaation ja jonkun dokumentissa mainitsemattoman käyttötapauksen, niin se pystyisi luomaan siitä oikeat ohjeet?