
Ai mikä tekoäly? Suurten kielimallien selitys
AI sitä, AI tätä – tekoäly on täällä ja nyt on pakko olla valmis. Tekoälystä kohistaan todella paljon – se yhtäältä tulee viemään työpaikkamme ja toisaalta auttamaan meitä keskittymään oleelliseen. Suurten kielimallien esiinmarssin ja nopean kehityksen väitetään olevan yhtä mullistavaa kuin aikanaan internetin synty. Mutta kuinka moni itsensä tavalliseksi pulliaiseksi kokeva oikeastaan ymmärtää, mistä on teknisesti tarkalleen on kysymys? Koitetaanpa selittää – ilman jargonia.
Tekoäly – mistä kaikki oikein alkoi?
Tekoäly saattaa nyt tuntua uudelta ja vähän pelottavaltakin ilmiöltä, mutta todellisuudessa sen tarinan voidaan ajatella alkaneen jo 1950-luvulta. Matemaatikko ja tietojenkäsittelyn uranuurtaja Alan Turing esitti silloin kysymyksen: voivatko koneet ajatella? Hän kehitti kuuluisan Turingin testin, jossa koneen älykkyyttä mitataan sillä, pystyykö se keskustelemaan niin sujuvasti, ettei ihminen erota sitä toisesta ihmisestä. Lähes jokainen internetin käyttäjä törmää Turingin teoriaan edelleen – CAPTCHA eli Completely Automated Public Turing test to tell Computers and Humans Apart erottelee esimerkiksi lomakkeilla ihmiset ja botit toisistaan varsin tehokkaasti (toistaiseksi).
Varsinainen murros koettiin 2010-luvulla, kun koneoppiminen ja syväoppiminen alkoivat tuottaa oikeasti toimivia ja hyödyllisiä tekoälyratkaisuja. Suurin osa meitä ympäröivästä tekoälystä perustuu juuri näihin menetelmiin: ne tekevät laitteista ja palveluista fiksumpia ilman, että me edes kiinnitämme siihen huomiota. Kun Applen Siri ymmärtää äänikomentosi tai Google-kääntäjä osaa parantaa käännöksiään ajan myötä, taustalla on koneoppimista – tekoäly, joka oppii jatkuvasti lisää käyttäjien antamasta datasta. Syväoppiminen, joka matkii ihmisaivojen toimintaa kerroksittain järjestetyillä neuroverkoilla, on taas mukana esimerkiksi siinä, kun Netflix suosittelee sinulle juuri sellaisia sarjoja, joista todennäköisesti tykkäät. Samalla tavoin Spotify osaa poimia soittolistoillesi biisejä, jotka sopivat makuusi, ja puhelimesi kamera tunnistaa kasvosi, jotta voit avata lukituksen nopeasti.
Kaikki tämä tapahtuu taustalla, ilman fanfaareja – mutta ilman koneoppimista ja syväoppimista moni meille nykyään itsestäänselvä asia olisi paljon kömpelömpi tai suorastaan mahdoton. Tekoäly ei siis ole vain tulevaisuuden science fictionia, vaan se pyörittää jo nyt arkeamme yllättävän monessa kohtaa.
Tekoäly ei oikeasti ”tiedä”, mitä on oikeudenmukaisuus tai ystävyys.
Mikä on suuri kielimalli?
Juuri nyt koettava teknologinen murros kumpuaa yhdestä tietystä ilmiöstä: tekoälypohjaisista suurista kielimalleista. Nämä kielimallit toimivat eräänlaisina digitaalisina aivoina. Ne ahmivat valtavat määrät tekstiä, tallentavat siitä oppimansa rakenteet ja lainalaisuudet, ja pystyvät tämän pohjalta tekemään päätelmiä ja muodostamaan järkevän kuuloisia vastauksia.
Kielimallien taika piilee niiden kyvyssä ennustaa, mikä sana todennäköisesti sopii seuraavaksi, perustuen kaikkeen aiemmin opittuun. Juuri tämä ennustuskyky tekee niistä niin sujuvia keskustelukumppaneita – ja siksi niiden kanssa käytävä vuoropuhelu tuntuu välillä melkein luonnolliselta keskustelulta ihmisen kanssa.
Tämän muistijärjestelmän ja ennustuskyvyn moottorina toimii transformer-neuroverkkoarkkitehtuuri. Mutta mitä se oikeastaan tarkoittaa?
Kuvitellaan, että transformer-neuroverkko on kuin jättimäinen muistikirja, joka lukee, vertaa ja yhdistelee asioita salamannopeasti. Toisin kuin vanhemmat tekoälymallit, jotka kävivät tekstiä läpi yksi sana kerrallaan, transformer pystyy tarkastelemaan tekstikokonaisuutta kerralla – sekä alun, lopun että keskikohdan. Se huomaa, mitkä sanat liittyvät toisiinsa, vaikka ne olisivat kaukanakin toisistaan.
Tätä kutsutaan huomio- eli attention-mekanismiksi, joka on transformerien salainen ase. Se tekee mallista niin fiksun, että se pystyy ymmärtämään, että esimerkiksi ”Apple” voi tarkoittaa joko hedelmää tai teknologiayhtiötä – riippuen siitä, mitä muuta tekstissä sanotaan.
Lisäksi, koska transformerit oppivat valtavista tekstimassoista – kuten kirjoista, verkkosivuilta ja tieteellisistä artikkeleista – ne saavat ”yleissivistyksen”, joka kattaa melkein minkä tahansa aihepiirin. Tämä laaja pohjatieto yhdistettynä tehokkaaseen muistiin ja huomiointikykyyn tekee suurista kielimalleista niin vaikuttavia.
Voidaanko ajatella, että tekoäly siis on oikeasti älykäs, vai toistaako se vain opittuja kaavoja? Totuus on jossain siltä väliltä. Suuri kielimalli ei varsinaisesti ymmärrä maailmaa kuten ihminen. Se ei koe tunteita, sillä ei ole omaa tahtoa eikä se tiedä, miltä mansikka maistuu. Sen älykkyys perustuu valtavaan määrään tekstiä, jonka pohjalta se ennustaa, mikä sana tai ajatus todennäköisesti kuuluu seuraavaksi. Toisin sanoen, tekoäly on mestari arvaamaan todennäköisimpiä jatkoja, mutta se ei oikeasti ”tiedä”, mitä on oikeudenmukaisuus tai ystävyys.
Teknologia: Lue lisää
Kannattaako tekoälybotit päästää sivustolle?
Jotta suuret kielimallit voivat oppia, niiden täytyy saada valtava määrä tekstiä. Tätä varten tekoälyn taustalla toimivat botit eli automaattiset ohjelmat kiertävät internetissä ja lukevat julkisesti saatavilla olevaa sisältöä – verkkosivuja, uutisia, foorumeita ja paljon muuta. Tämä prosessi tunnetaan nimellä web scraping eli verkkosisällön kaapiminen.
Kun tekoälybotit tekevät tätä massiivisessa mittakaavassa, ne voivat aiheuttaa merkittävää kuormaa verkkosivujen palvelimille. Jokainen sivunlataus tekoälybotin toimesta on http-kysely, eli se vastaa sitä, kuin ihminen klikkaisi sivun auki. Kun miljoonat botit käyvät läpi miljardeja sivuja, se voi lisätä verkkosivustojen kaistanleveyden tarvetta ja jopa hidastaa sivuston toimintaa.
Ensireaktio voi olla halu estää tekoälybotit – ne kuormittavat palvelinta, vievät sisältöä ilman lupaa ja voivat jopa käyttää kerättyä tietoa kaupallisiin tarkoituksiin, joista sivuston omistaja ei hyödy mitenkään.
Mutta on myös toinen näkökulma: Jos sivusto estää tekoälybotit kokonaan, sen sisältö saattaa jäädä tekoälyjen ”sokeaan pisteeseen”. Tämä voi tarkoittaa, että tulevaisuuden tekoälyavusteiset hakukoneet, chatbotit tai digitaaliset assistentit eivät tunne kyseistä sivustoa, eivätkä osaa ohjata käyttäjiä sinne. Toisin sanoen – tekoälystä syrjäytyminen voi johtaa siihen, että sivusto menettää näkyvyyttä ja kävijöitä pitkällä aikavälillä.
Tämä on erityisen tärkeää tietoa tarjoaville sivustoille – uutismediat, oppimisalustat, asiantuntijablogit – jotka haluavat olla osa tulevaisuuden tekoälyavusteista tiedonhakua. Jos tekoäly oppii, että sivusto on luotettava tiedonlähde, se voi suositella sitä yhä useammin, mikä tuo lisää liikennettä.
Pitäisikö tekoälyä pelätä?
Tämä on kysymys, jota ei voi sivuuttaa. Tekoäly ei itsessään ole hyvä tai paha – se on työkalu. Sen vaikutukset riippuvat siitä, miten me ihmiset sitä käytämme. Tekoäly voi auttaa lääkäreitä löytämään syöpiä varhaisessa vaiheessa tai auttaa tutkijoita ratkaisemaan ilmastonmuutokseen liittyviä ongelmia. Toisaalta, huonossa käytössä tekoäly voi vääristää tietoa, levittää valeuutisia tai vahvistaa ennakkoluuloja.
Tärkeintä onkin, että opimme ymmärtämään, mitä tekoäly on ja mihin se pystyy. Kun meillä on realistinen käsitys tekoälyn mahdollisuuksista ja rajoituksista, voimme tehdä fiksumpia päätöksiä sen käytöstä.
Tekoäly ei ole mystinen, vain nörteille tarkoitettu ilmiö. Se on työkalu, joka voi auttaa meitä kaikkia, kunhan pidämme langat käsissämme. Mitä enemmän ymmärrämme tekoälyä, sitä paremmin voimme käyttää sitä viisaasti – ja tehdä siitä osan parempaa tulevaisuutta.