top of page

Kolumni | ”Se vaan arvaa sanoja” – miksi tämä käsitys tekoälystä on vanhentunut?

Writer: Antti InnanenAntti Innanen

Päivitetty: 19. maalisk.

🎧 Kuuntele kirjoitus alta! Tekoälyfoorumi julkaisee kaikki jutut myös audiona. Kuuntele milloin vain, missä vain – vaikka puhelimen näyttö lukittuna.


 

Hymyilevä kuva Antti Innasesta mustassa poolopaidassa harmaalla taustalla.
"Nykyisiä tekoälymalleja ei enää kannata nähdä vain sanoja ennustavina koneina." kirjoittaa tietokirjailija Antti Innanen

Vielä jokin aika sitten korostimme koulutuksissamme usein, että tekoäly ei ymmärrä asioita, vaan ainoastaan ennustaa seuraavaa sanaa tai lausetta.


”Vaikka vaikuttaakin siltä, että tekoäly pyrkii ratkaisemaan ongelman, niin oikeasti kyseessä on vain kehittynyt sananarvauskone!”


Tämä tuntui jollakin tapaa vastuulliselta. Halusimme korostaa tekoälyn rajallisuutta ja sitä, että se ei oikeasti ajattele mitään.


Tämä käsitys tekoälystä on vanhentunut. Me emme käytä sitä. 


Nykyisellään uudet tekoälymallit tekevät paljon enemmän kuin ennustavat sanoja tai lauseita. Ne osaavat:

  • Pilkkoa monimutkaisia ongelmia selkeisiin vaiheisiin

  • Arvioida ja kehittää omia vastauksiaan

  • Säilyttää johdonmukaisuuden pitkissäkin teksteissä

  • Tasapainottaa useita tavoitteita yhtä aikaa


Tekoäly ei ymmärrä asioita samalla tavalla kuin ihmiset ymmärtävät. Eikä tekoäly edelleenkään ajattele samalla tavalla kuin ihminen. Moderni tekoäly kuitenkin käsittelee tietoa tavalla, joka muistuttaa ajattelua paljon enemmän kuin pelkkä tilastollinen ennustaminen.


Käytännön esimerkki: yrityksen perustaminen

Kuvitellaan tekoälylle annettava yksinkertainen tehtävä: ”Kirjoita vaiheittainen suunnitelma pienen yrityksen perustamiseksi.”


Vanhempi tekoälymalli voisi vastata näin:

”Vaihe 1: Aloita yritys. Vaihe 2: Tee suunnitelma. Vaihe 3: Hanki rahoitusta...”


Tämä on pelkkää tilastollista sanojen ketjutusta, perustuen tekoälyn koulutusmateriaaliin.


Moderni tekoäly taas lähestyy tehtävää eri tavalla. Se tunnistaa yrityksen perustamisen tärkeimmät vaiheet (esimerkiksi markkinatutkimus, juridiset vaatimukset, rahoitus ja käytännön toimet) ja käsittelee jokaista vaihetta johdonmukaisesti. Lopputulos on lähellä huolellisesti mietittyä liiketoimintasuunnitelmaa.


Käytännön esimerkki: juridiikka ja sosiaalisen median käyttöehdot

Jos tekoälyltä pyydettäisiin sosiaalisen median käyttöehtoja, vanhemmat mallit tarjoaisivat todennäköisesti yleisiä ja tuttuja juridisia fraaseja:


”Käyttäjä käyttää palvelua omalla vastuullaan. Yhtiö pidättää oikeuden lopettaa käyttöoikeuden milloin tahansa...”


Nämä sanat esiintyvät tekoälyn koulutusmateriaalissa, ja siksi ne tulevat tilastollisesti usein perättäin.


Moderni tekoälymalli sen sijaan ymmärtäisi kokonaisuuden eri näkökulmista (käyttäjän oikeudet, sisällön omistus, vastuunrajoitukset) ja kykenisi ajattelemaan ongelmaa syvemmin. Se voisi tunnistaa, että pitkiä käyttöehtoja ei lueta, ja pyrkisi ratkaisemaan tämän ongelman laatimalla tiivistelmän jokaisesta kappaleesta.


Tämä on itselleni ollut käänteentekevä huomio: modernit tekoälyt todella pyrkivät ratkomaan käyttäjän ongelmia. Lisäksi ne tekevät sitä ihmisille tutuilla keinoilla: sisäisellä monologilla, testauksella, kritiikillä ja uusilla versioilla.


Mikä mahdollisti kyseisen muutoksen?

Kehityksen taustalla on kolme tärkeää teknologista askelta:


  • Mittakaava: Suuremmat tekoälymallit mahdollistivat uusia kykyjä, joita ei ollut eksplisiittisesti ohjelmoitu.

  • Arkkitehtuuri: Transformer-rakenteet ja huomiomekanismit tekevät tekstintuotosta johdonmukaisempaa ja kontekstiherkempää.

  • Koulutusmenetelmät: Ihmispalautteeseen perustuva vahvistusoppiminen (RLHF) ohjaa malleja tuottamaan vastauksia, joita ihmiset pitävät hyödyllisinä. 


Käsitys tekoälystä on muuttunut – miten meidän pitäisi puhua siitä?

Nykyisiä tekoälymalleja ei enää kannata nähdä vain sanoja ennustavina koneina. Ne eivät ehkä ymmärrä maailmaa ihmisten tavoin, mutta ne simuloivat päättelyä ja suunnittelua tavoilla, jotka ylittävät selvästi pelkän sanojen ennustamisen.


On vaikea kiteyttää tätä kehitystä yhdellä termillä. Ehkä lähimmäksi pääsee ”todennäköisyyksiin perustuva simulaatio”.


Sanoilla ja ajattelumalleilla on suuri merkitys sille, miten tekoälyä hyödynnämme.


Tekoälyn inhimillistäminen voi johtaa meitä harhaan. Toisaalta tekoälyn kuvaaminen pelkkänä ”sanakoneena” jättää huomiotta sen, miten koneiden ”ajattelu” on kehittynyt.


Tarvitsemme uusia analogioita ja tarkempia ajatusmalleja, jotka kuvaavat paremmin sitä, miten tekoäly oikeasti toimii. Jos keksit paremman kuvauksen, kerro meille!


 

Piditkö tästä artikkelista? Tilaa ilmoitukset uusista Tekoälyfoorumin julkaisuista suoraan sähköpostiisi. Arvostamme myös valtavasti, mikäli jätät meille arvostelun Googlessa. Kiitos. 💙



1 Comment


Hyvä kirjoitus ja tästä tuli itselle on uusia ajatuksia! Tekoäly on iso murros, jonka vaikutuksia tulee pohdittua päivittäin..

Like
bottom of page