Tekoäly apuna faktantarkistuksessa? Muista kriittinen ajattelu ja poimi vinkit talteen

Juttusarjan ensimmäisessä osassa annoimme vinkkejä tekoälyn käytölle tiedonhaussa. Toisessa osassa kerromme, miten tekoäly voi toimia apurina faktantarkistuksessa. Sen väitteet pitää kuitenkin muistaa tarkistaa aina itse.

Faktabaari ei tarkista faktoja tekoälyllä. Se kuitenkin testaa ja seuraa jatkuvasti sitä, miten tekoälyä voi käyttää faktantarkistusprosessin tukena ja apuna. Keväällä 2025 Faktabaarin toimitus esimerkiksi testasi sitä, voisiko tekoäly auttaa väitteiden tunnistamisessa ja tarkistamisessa vaalitentin aikana.

Lue lisää: Factiversen tekoälysovellus listasi 128 väitettä MTV:n Puheenjohtajatentissä

Moni faktantarkistaja suhtautuu tällä hetkellä epäillen tai ainakin ristiriitaisesti siihen, miten paljon hyötyä tekoälytyökaluista todellisuudessa on faktantarkistuksessa. Myös Ylen verifiointitiimissä työskentelevä toimittaja Johanna Vehkoo on skeptinen.

“Pikemminkin toivoisin, että toimittajat eivät luottaisi kovin paljon tekoälyyn faktojen tarkistamisessa”, Vehkoo naurahtaa.

Hänkin silti seuraa tarkasti tekoälytyökalujen kehitystä ja testailee niitä.

Joissain faktantarkistustehtävissä tekoäly voi olla hyödyksi. Faktabaari kokosi etenkin toimittajille, tutkijoille, viestijöille ja muille tiedon tuottamisen ammattilaisille vinkkejä siihen, miten tekoälyn voi valjastaa faktantarkistusapuriksi. Mukana on sekä Faktabaarin että Vehkoon vinkkejä.

Tekoäly arvioi kuvien aitoutta

Erilaisia tekoälykuvien, -tekstien, -videoiden ja -ääninauhojen tunnistustyökaluja eli niin sanottuja “AI detector” -työkaluja on netti pullollaan, ja monet niistä ovat hyvin epäluotettavia. Tällä hetkellä yksi kohtalaisen tarkka työkalu, joka arvioi, onko kuva aito, muokattu vai tekoälyllä tehty, on Image Whisperer, joka löytyy osoitteesta https://imagewhisperer.org/. Työkalu on suunnattu erityisesti toimittajille, tutkijoille ja faktantarkistajille. Sen on tehnyt tutkiva toimittaja ja kouluttaja Henk van Ess.

Image Whisperer paitsi arvioi kuvan aitoutta, myös etsii kuvasta muuta tietoa, kuten sen, missä kuva on voitu ottaa, missä muualla se on aikaisemmin julkaistu ja löytyykö kuvan metadatasta tietoja. Tällaista on esimerkiksi tieto kuvaamispaikasta ja -ajasta, asetuksista ja kamerasta. Ohjelma antaa myös ehdotuksia siihen, miten kuvaa voisi tutkia tarkemmin.

Myös Image Whisperer tekee virheitä. Faktabaarin testien perusteella se on kuitenkin monipuolisempi kuin monet muut kuvien aitoutta arvioivat tekoälytyökalut tällä hetkellä.

Käänteinen kuvahaku, joka löytyy esimerkiksi Googlelta ja Yandexilta, on edelleen hyvä perustyökalu kuvien tutkimiseen.

Palveluiden omat tunnistustyökalut

Vehkoo toivoisi, että yritykset, jotka tarjoavat generatiivisen tekoälyn palveluita, kehittäisivät yleisön käyttöön myös työkaluja, jotka tunnistavat, onko teksti, kuva, video tai ääninauha tehty tekoälyllä.

“Ilmeisin juttu, jossa tekoäly voisi auttaa faktantarkistuksessa, on nimenomaan tekoälysisältöjen tunnistamisessa. Se on ikävän huonolla tolalla.”

Muutamia lupaavia esimerkkejä on. Tällä hetkellä ElevenLabs, jolla voi tehdä tekaistuja ääninauhoja ja äänikloonauksia eli niin sanottuja deepfake-ääninauhoja, tarjoaa kohtalaisen luotettavaa tunnistustyökalua, joka havaitsee, jos jokin ääninauha on tehty ElevenLabsin omalla työkalulla. Se ei kuitenkaan tunnista muilla työkaluilla tehtyjä deepfake-ääniä.

Toukokuussa Google tiedotti, että sen kehittämä SynthID-tunnistustyökalu tunnistaisi vesileimojen avulla sisällöt, jotka on tehty Googlen omilla tekoälytyökaluilla. SynthID ei kuitenkaan ole vielä laajasti yleisön käytössä. Tällä hetkellä sillä voi testata vain Googlen työkaluilla tehtyjen kuvien tunnistusta Gemini-sovelluksessa. Vehkookin kertoo olevansa vasta jonotuslistalla testaamaan SynthID:tä, eikä siksi toistaiseksi tiedä, miten hyvin se toimii.

Geopaikannukseen tukea

Bellingcat testasi hiljattain sitä, miten hyvin laajoihin kielimalleihin (LLM) pohjautuvat tekoälytyökalut kykenevät geopaikannukseen. Bellingcatin artikkeli löytyy täältä.

Johtopäätös oli, että kyvyt vaihtelevat paljon. Testihetkellä alkusyksystä 2025 paras geopaikantaja oli Googlen AI Mode, mutta täydellinen sekään ei ollut. Kaikki työkalut tekivät virheitä. Googlen AI Modekin ilmoitti välillä suurella itsevarmuudella täysin väärän paikan.

Vehkoo neuvoo, että laajojen kielimallien geopaikannusta voi kokeilla ja katsoa, saisiko niistä jotakin apua kuvan tai videon kuvaamispaikan löytämiseen. Jälleen kerran on kuitenkin tärkeää, ettei luota sokeasti tekoälyn vastaukseen.

“Aina sen joutuu manuaalisesti ja omin silmin tarkistamaan.”

Bellingcat huomautti, että tekoälytyökalujen “taidot” eivät välttämättä kehity koko ajan, vaan niiden kyvykkyys esimerkiksi geopaikannukseen saattaa ajan saatossa jopa heikentyä.

Tietoa eri kielillä

Tekoälytyökalujen avulla tiedonhakua voi laajentaa myös niihin kieliin, joita ei itse osaa, pyytämällä esimerkiksi: “Haluan tietää, millaisia korruptiotapauksia Suomen naapurimaissa on ollut. Etsi tietoa viron, tanskan ja norjan kielillä. Linkitä lähteet.”

Tai “etsi venäjänkielisistä lähteistä tietoa [asiasta x]”.

Tekoälytyökaluilla voi myös kääntää kuvassa tai videolla näkyviä vieraskielisiä tekstejä tai litteroida vieraskielistä puhetta, jonka voi sitten kääntää vaikkapa suomeksi tai englanniksi.

Johanna Vehkoo muistuttaa, että litterointityökalutkin hallusinoivat eli keksivät asioita.

Yhdysvalloissa monessa sairaalassa on käytössä Whisper-työkalu, joka litteroi lääkärin ja potilaan välistä keskustelua. Se kuitenkin tekee virheitä ja hallusinoi. Myös esimerkiksi Zetlandin kehittämä Good Tape, jota Suomessakin moni toimittaja käyttää, varoittaa verkkosivuillaan, että jos nauhoituksessa on esimerkiksi hiljaisia kohtia, tekoälyteknologiaan pohjautuvat litterointityökalut voivat hallusinoida sinne puhetta. Siksi sitaatit on aina syytä tarkistaa myös alkuperäiseltä ääninauhalta.

Tekstin syöttäminen tekoälylle?

Voisiko oman valmiin tekstinsä syöttää ChatGPT:lle tai muulle tekoälypalvelulle ja pyytää tarkistamaan siitä faktat? Vehkoo ei missään nimessä suosittele tätä. Tekoälytyökaluille ei pidä ainakaan syöttää mitään henkilötietoja, salassapidettäviä asioita tai lähdesuojan alaisia tietoja. Tekstin syöttäminen tekoälylle voi olla ongelmallista myös tekijänoikeuksien näkökulmasta.

Monissa mediataloissa onkin tiukat säännöt siihen, mitä talon ulkopuolisilla tekoälytyökaluilla saa ylipäätään tehdä.

Turvallisinta on käydä oman tekstin faktaväitteet kohta kohdalta itse läpi niin, että pysähtyy jokaisen väitteen kohdalla miettimään sitä, mistä tieto on peräisin. Näin lähteet voi käydä vielä kerran läpi.

Jos tekoälyä käyttää apuna, tekstin faktaväitteet kannattaa pilkkoa osiin, esimerkiksi näin: “Pitääkö paikkansa, että THL:n tekemän MoniSuomi-tutkimuksen mukaan 44 % maahanmuuttaneista on korkeakoulutettuja?”.

Silloinkin tiedon etsiminen ilman tekoälyn apua voi kuitenkin olla nopeampaa ja luotettavampaa.

Lue myös: Faktabaarin vinkit tekoälyn käytölle tiedonhaussa

info@faktabaari.fi

Evästeet

Käytämme sivustollamme yksityisyyden suojaavaa analytiikkaa palveluidemme parantamiseksi.

Lue lisää tietosuoja käytännöistämme täältä.