Tekoälypohjaiset suosittelualgoritmit somepalveluissa

TEKOÄLYSTÄ PUHUTTAESSA MONELLE tulee ensimmäisenä mieleen keskustelubotit kuten ChatGPT ja Copilot sekä tekoälymalleja hyödyntävät kuvageneraattorit. Samalla voi jäädä huomaamatta, että paljon useammin käytämme tekoälyä muiden kuin varsinaisten tekoälysovellusten parissa: nimittäin sosiaalisen median palveluissa.

Käytetyimmissä somepalveluissa koneoppimista on hyödynnetty algoritmin suositusten teossa viimeistään vuodesta 2016 lähtien. Varhaisimmat suosittelujärjestelmien kokeilut tehtiin jo vuosia aikaisemmin.

Erilaiset suosittelualgoritmit

Suosittelujärjestelmiä käytetään lukuisissa tietojärjestelmissä ja sovelluksissa. Sosiaalisen median palveluissa niihin viitataan yleisesti käsitteellä suosittelualgoritmi tai personoitu algoritmi. Kyse on ohjelmista, jotka käyttävät koneoppimista isojen datamassojen seulomiseen luodakseen käyttäjille sopivia suosituksia. Tavallisimmin kyse on somepalvelussa käyttäjille näkyvän sisältösyötteen muodostamisesta. Suosittelualgoritmit siis käytännössä päättävät, mitä sisältöjä ja missä järjestyksessä käyttäjille näytetään sosiaalisen median palveluissa ja sovelluksissa.

Suosittelujärjestelmät voidaan jakaa pääasiassa kolmeen ryhmään: sisältöpohjaisiin, yhteistoiminnallisiin sekä hybridimalleihin, jotka yhdistelevät useita lähestymistapoja. (1) (2)

  • Sisältöpohjainen suosittelualgoritmi tekee suosituksia käyttäjille ja sisällöille annettuja tietoja vertaamalla. Sovellus voi esimerkiksi kysyä käyttäjältä, mistä aiheista tämä on kiinnostunut, ja näyttää sitten valittujen kategorioiden mukaisia sisältöjä.
  • Yhteistoiminnallinen suosittelualgoritmi tekee suosituksia käyttäjien toiminnasta kertyneen datan perusteella. Ajatuksena on, että yksittäisen käyttäjän sijasta sisältöjen suodatukseen käytetään useiden käyttäjien tietoja, ja aiemmin samoista aiheista kiinnostuneet käyttäjät ovat samoista asioista kiinnostuneita myös tulevaisuudessa. Datana voidaan käyttää esimerkiksi käyttäjien julkaisuihin antamia reaktioita sekä käyttäjien sosiaalista verkostoa.
  • Hybridisuosittelualgoritmit yhdistelevät sisältöpohjaista ja yhteistoiminnallista lähestymistapaa sekä muita menetelmiä. Algoritmi voi esimerkiksi suositella uusille käyttäjille sisältöjä tämän sijainnin tai kiinnostuksenkohteiden perusteella, ja siirtyä sitten yhteistoiminnallisiin suosituksiin sitä mukaan, kun käyttäjän toiminnasta kertyy tietoa, jota voidaan verrata muista käyttäjistä ja sisällöistä olevaan dataan.

Koska käyttäjien kiinnostukset, toimintatavat ja aktiivisuus vaihtelevat, algoritmeja on pyritty ­kehittämään yhä paremmin käyttäjien tottumuksiin ja eroihin mukautuviksi. Tämä näkyy hybridisuosittelualgoritmien yleistymisenä. Esimerkiksi hyvin aktiiviselle sosiaalisen median käyttäjälle tarvitaan huomattavasti suurempi määrä ja tuoreempia suosituksia kuin käyttäjälle, joka käy sovelluksessa vaikkapa vain muutaman kerran viikossa. 

Nykyiset verkko- ja somepalvelut pyrkivät keräämään mahdollisimman tarkasti käyttäjien toimintaa kuvaavaa tietoa, jonka perusteella suosittelualgoritmit voisivat tehdä mahdollisimman hyvin käyttäjille sopivia valintoja. Tämä on merkinnyt sitä, että käyttäjistä kerätään yhä enemmän erilaisia henkilötietoja ja toimintaa kuvaavaa dataa.

Käyttäjädatan määrän kasvaessa ja monimutkaistuessa sovellukset ovat kehittäneet tekoälypohjaisia suosittelualgoritmeja. Tekoälypohjaisten algoritmien etuna on, että ne voivat hyödyntää tehokkaasti laajaa käyttäjäkohtaista tietovarantoa ja mukautua kunkin käyttäjän toimintaan. Näin suositusten teossa voidaan painottaa eri muuttujia sen mukaan, millaista dataa käyttäjästä on olemassa. Tämä on selvä etu verrattuna kankeisiin suosittelualgoritmeihin, jotka toimivat jokaisen käyttäjän tapauksessa samojen sääntöjen mukaan.

Nykyiset suosittelualgoritmit käyttävät useita tekoälytekniikoita kuten koneoppimista, syväoppimista ja keskusteluboteista tuttua luonnollisen kielen käsittelyä. Toisaalta tekoälyn käytöstä huolimatta käyttäjät voivat kokea somepalvelujen algoritmien valinnat heille huonosti sopiviksi. 

On hyvä tiedostaa, että verkko- ja ­somepalvelujen algoritmeja muutetaan usein. Muutokset johtuvat algoritmien toiminnan kehittämisestä, kun sosiaalisen median palvelut pyrkivät optimoimaan niiden toimintaa tarkoituksiinsa sopiviksi. Esimerkiksi tekoälyn kehittyessä uusia tekoälytoimintoja pyritään hyödyntämään suosittelualgoritmeissa yhä enemmän.

Käytettiinpä apuna tekoälyä tai ei, on hyvä pitää mielessä kaksi asiaa, jotka vaikuttavat olevan suhteellisen pysyviä: ensinnäkin algoritmien tarkoitus on yleensä pitää käyttäjät palvelussa mahdollisimman pitkään, ja toiseksi algoritmit ovat alttiita manipulaatiolle. Esimerkiksi mainostajat, poliittiset vaikuttajat ja disinformaation levittäjät tutkivat jatkuvasti algoritmien toimintaa ja yrittävät saada niiden avulla mahdollisimman suuren näkyvyyden julkaisuilleen. (3)

Facebook ja sosiaalisen verkoston suodattaminen

Tekoälyalgoritmien pioneeri sekä hyvässä että pahassa on ollut Facebook. Facebook julkaisi uutissyötteen (News Feed) kaksi vuotta palvelun avaamisen jälkeen vuonna 2006. Aluksi käytössä ei ollut suosittelualgoritmia, vaan uutissyöte sisälsi kaiken Facebook-­kavereiden toiminnan aikajärjestyksessä.

Facebook julkaisi ensimmäisen uutissyötettä ohjaavan algoritminsa vuonna 2009. Tapahtumaa voi jälkikäteen pitää yhteisöpalvelujen suosittelualgoritmien alkusysäyksenä. Tarkoituksena oli näyttää käyttäjille kiinnostavimmat sisällöt  sen sijaan, että he näkisivät kaikkien kavereidensa julkaisut. Algoritmi käytti pääasiassa kolmea muuttujaa: käyttäjän ja julkaisun läheisyyttä, sisällön painoa ja julkaisun ajankohtaa. Kyse oli siten yhteistoiminnallisesta suosittelualgoritmista, jossa käyttäjien välisellä sosiaalisella verkostolla oli iso merkitys. Myöhemmin tämän tyyppistä algoritmia on totuttu pitää tavallisena nimenomaan verkostoitumispalveluille. (4) (5) (6)

Algoritmin käyttöönotto oli merkittävä muutos Facebookin silloisille 300 miljoonalle käyttäjälle. Kun käyttäjien ei enää ”tarvinnut” lukea kaikkien kavereidensa julkaisuja, verkostoituminen yhä useampien kanssa oli mahdollista. Vuonna 2009 keskimääräinen Facebook-kavereiden määrä oli 120, mutta vuoteen 2011 mennessä lukema kasvoi 190:ään. Silloin uutissyötteen algoritmiin tehtiin toinen merkittävä muutos ottamalla käyttöön koneoppimiseen pohjautuva suosittelualgoritmi. (7)

Vuoteen 2013 mennessä uusi tekoälypohjainen suosittelualgoritmi käytti jopa 100 000 eri muuttujaa. Tämä merkitsi yhä personoidumpaa suosittelua: Käyttäjät, jotka olivat aktiivisia Facebook-ryhmissä, näkivät enemmän ryhmien julkaisuja. Ne jotka tykkäsivät usein valokuvista, näkivät yhä useammin valokuvajulkaisuja. Linkkien klikkaajille puolestaan tarjoiltiin entistä enemmän linkkejä ja niin edelleen. (8)

Kun tekoäly seuloi sosiaalisen verkoston kiinnostavimmat julkaisut, käyttäjät saattoivat verkostoitua yhä useampien kanssa ilman, että uutissyöte täyttyi epäkiinnostavasta ”kohinasta”. Vuonna 2016 yhdysvaltalaisilla käyttäjillä oli keskimäärin jo 350 Facebook-­kaveria ja 18–24-vuotiailla peräti 650.

Alkuvuosina Facebook oli ollut tuttavien välinen kommunikointialusta, mutta kaverimäärien kasvu merkitsi mahdollisuutta yhä suuremman julkisuuden saavuttamiseen. Facebookissa jaettujen linkkien merkitys tuli kaupallisille tahoille aiempaa tärkeämmäksi, sillä Facebookissa saavutettu orgaaninen näkyvyys saattoi merkitä tuhansia ja taas tuhansia kävijöitä yritysten verkkosivuille. Ihmissuhteiden hoidon rinnalle käyttömotiiveiksi saattoivat tulla massasuosion tavoittelu, liiketoiminta ja poliittinen vaikuttaminen. Facebookin omat työntekijät kuvasivat muutosta kontekstin romahtamisena. (9)

Vuonna 2016 Facebook julkaisi emoji-reaktiot ”ihastu”, ”haha”, ”vau”, ”surullinen” ja ”vihainen”. Niiden avulla algoritmi pystyi päättelemään käyttäjien tunnetilan ja suosittelemaan heille sitä vastaavia julkaisuja. Samalla tekoälyä hyödyntävästä ­hybridistä suosittelualgoritmista tuli niin monimutkainen, että sen hallinta osoittautui Facebookille vaikeaksi.

Emoji-reaktioiden vaikutuksessa ­suosittelualgoritmiin oli yksi paha ongelma. Emoji-reaktioille annettiin normaaliin tykkäykseen verrattuna moninkertainen painoarvo algoritmin suosittelupisteiden laskennassa. Tämän takia julkaisut, joihin reagoitiin runsaasti esimerkiksi vihainen- ja haha-­reaktioilla saattoivat saada suhteettoman paljon näkyvyyttä algoritmin nostaessa niitä käyttäjien syötteisiin. Vihaisuuden ja muiden voimakkaiden tunteiden synnyttämisestä tuli siten tehokas keino saada julkaisuille laaja näkyvyys Facebookissa. Tämä ei jäänyt huomaamatta tahoilta, jotka pyrkivät vaikuttamaan ihmisten asenteisiin ja mielipiteisiin. (10) (11)

Facebookilta kesti vuosia tiedostaa ja korjata emoji-reaktioiden suhteettoman iso vaikutus suosittelualgoritmin toimintaan. Vuonna 2021 Facebookin entisen työntekijän vuotamien asiakirjojen mukaan Facebook oli yrittänyt estää tunnereaktioiden ylisuuren vaikutuksen suosituksiin, mutta tätä varten kehitetty ominaisuus ei toiminut. Kuvaavaa on, että uutissyötteen algoritmi saattoi antaa suuren näkyvyyden esimerkiksi disinformaatiota, vihapuhetta ja klikkiotsikoita sisältäville julkaisuille samaan aikaan, kun ­yhtiön moderaattorit tekivät parhaansa kyseisten sisältöjen karsimiseksi.

Facebookin tutkijat huomasivat emoji-reaktioiden käytön virheellisen ja vahingollisen sisällön levittämiseen vuonna 2019. Vihainen-reaktioiden vaikutusta suosittelualgoritmiin laskettiin useaan kertaan ja lopulta se nollattiin vuonna 2021. Tämä tapahtui sen jälkeen, kun Facebook oli joutunut kovan julkisen kritiikin kohteeksi vuosien 2016 ja 2020 Yhdysvaltojen presidentinvaalien jälkiselvittelyissä. Yhtiötä syytettiin disinformaation ja vaalivaikuttamisen torjunnan epäonnistumisesta. Myös Suomen vuoden 2019 eduskuntavaalien kampanjoinnissa käytettiin tehokkaasti tunnepitoisia Facebook-julkaisuja. (12)

Vuoden 2021 jälkeen Facebook on jatkanut tekoälyohjatun suosittelualgoritminsa kehittämistä. Tietosuojasääntelyn lisääntymisen myötä Facebook on alkanut julkaista säännöllisesti tietoa, millaisia julkaisuja algoritmi valitsee keskimääräisen ­Facebook-käyttäjän syötteeseen. Viime vuosina Facebook on vähentänyt erityisesti linkkien näkyvyyttä syötteessä sekä lisännyt sellaisten julkaisujen määrää, joiden julkaisija ei kuulu käyttäjän Facebook-kavereiden verkostoon. Muutokset merkitsevät sitä, että Facebook pyrkii pitämään käyttäjät entistä tiiviimmin omassa palvelussaan, ja se on siirtymässä vaiheittain kohti profilointiin perustuvaa kiinnostuspohjaista suosittelua, jossa käyttäjien sosiaalisella verkostolla on yhä pienempi merkitys. (13)

Youtuben ongelma: mitä miljoonista videoista suositella seuraavaksi?

Youtuben tarve tehokkaalle suosittelualgoritmin oli ilmeinen, kun vain kolme vuotta palvelun julkaisun jälkeen vuonna 2008 sivustolle oli ladattu yli 45 miljoonaa videota. Videoita saattoi selata kanavittain, niiden suosion mukaan listattuna sekä tekstipohjaisen haun kautta. Hakutoiminto ei kuitenkaan toiminut kovin hyvin, kun useimmissa videoissa ainoa hakukriteeriksi kelpaava oli videon otsikko. (14)

Lähin verrokki Youtuben tarpeelle suosittelualgoritmin kehittämiseksi oli Netflixin vuosina 2006–2009 sponsoroima kilpailu, jossa tavoitteena oli kehittää mahdollisimman tarkka elokuvien suosittelujärjestelmä. (1)5 Netflix oli aloittanut DVD-elokuvien vuokraamisen postitse, ja sen tietokanta käsitti tuolloin noin 100 000 DVD:tä. Yhtiö lupasi miljoona dollaria sille, joka kehittäisi vähintään 10 prosenttia sen tuolloista algoritmia paremman suosittelujärjestelmän. Netflixiin verrattuna Youtubella oli paljon suurempi videovalikoima ja vähemmän tietoa käyttäjistä.

Google aloitti koneoppimisen kehittämisen Youtuben videosuositusten tekoon vuonna 2007. Yhtiön tutkijat päätyivät luomaan videoista verkoston sen perusteella, kuinka monta kertaa samat käyttäjät olivat katsoneet saman videon. Oletettavasti käyttäjille kannatti suositella videoita, joita aiemminkin samoista videoista kiinnostuneet käyttäjät olivat katsoneet. Haasteena oli videoiden suuri määrä, jonka takia oli mahdotonta laskea jokaiselle käyttäjälle uusia video­suosituksia joka kerta, kun he siirtyivät eri videoiden välillä. Toisaalta käyttäjille ei haluttu ehdottaa vain suosituimpia videoita, vaan heidän haluttiin voivan löytää uusia kiinnostavia sisältöjä.

Ratkaisuna Youtuben kehittäjät loivat useita tekoälymalleja, jotka käyttivät koneoppimisen datana käyttäjistä kertynyttä lokitietoa. Tekoälymallien avulla käyttäjille voitiin ehdottaa lukuisia ”aiheeseen liittyviä videoita” (Related videos), jotka perustuivat heidän juuri aiemmin katsomiinsa videoihin. Näin sai alkunsa yksi varhaisista yhteistoiminnalliseen suodatukseen perustuvista sosiaalisen median suosittelu­algoritmeista. Toisin kuin Facebookissa, suosittelu ei perustunut käyttäjien sosiaaliseen verkostoon, vaan videoista muodostettuun verkostoon.

Youtube on ollut pioneeri tekoälytoimintojen kehittämisessä muutenkin kuin suosittelualgoritmien osalta. Vuonna 2009 Youtube lanseerasi puheentunnistukseen perustuvan automaattisen videoiden tekstityksen ja vuonna 2013 ihmisten ja eläinten – kuten kissojen – kasvojentunnistuksen. (16) (17)

On epäselvää, miten pitkään Youtuben varhainen tekoälyalgoritmi oli käytössä videoiden suosituksissa. Vuonna 2016 käyttöön kuitenkin tuli kehittyneempi syväoppimista ja neuroverkkoja hyödyntävä suosittelualgoritmi. Uusi tekoälypohjainen algoritmi mahdollisti aiempaa tehokkaamman sisältöjen moderoinnin esimerkiksi lapsille sopimattoman tai muulla tavalla vahingollisen sisällön tunnistamiseksi automaattisesti. Vuodesta 2017 lähtien Youtube on pyrkinyt nostamaan algoritmissa luotettavien tiedotus­välineiden sisältöjä. Vuonna 2019 Youtube kehitti algoritmia edelleen niin, että kyseenalaisia väitteitä sisältävien videoiden suosittelua vähennettiin. (18) (19)

Tiktokin koukuttava algoritmi

Tiktok on moneen muuhun somepalveluun verrattuna uusi. Sen sisarsovellus Douyin julkaistiin Kiinassa vuonna 2016 ja Tiktok muissa maissa seuraavana vuonna. Suomessa Tiktokin käyttö yleistyi erityisesti vuosina 2019–2021. (20)

Tiktokin emoyhtiö Bytedance on ennen muuta teko­äly-yritys. Sen ensimmäisiä tuotteita vuonna 2012 oli kiinalaisten uutisten suosittelusovellus Toutiao, joka perustuu koneoppimista ja luonnollisen kielen prosessointia hyödyntävään käyttäjäkohtaisesti personoituun suosittelualgoritmiin. Vuonna 2015 sovellukseen lisättiin lyhytvideot, ja seuraavana vuonna Toutiao oli jo Kiinan suosituin lyhytvideopalvelu. (21)

Toisin kuin monella muulla somepalvelulla, ­Bytedancella oli valmiina tehokas ­suosittelualgoritmi sen julkaistaessa Douyinin ja Tiktokin. On hyvä huomata, että Tiktokin ”keksintö” ei ollut ­lyhytvideot sisältömuotona, vaan nimenomaan ­suosittelualgoritmi, joka onnistui vangitsemaan ­käyttäjien mielenkiinnon. Tuolloin oli jo monia laajasti käytettyjä ­lyhytvideosovelluksia kuten Vine (2012-2017) ja Snapchat, johon videomuotoiset snapit tulivat vuonna 2012 ja storyt 2013. (22) (23) Tiktok yhdisti julkisiin lyhytvideoihin profilointiin perustuvan tekoäly­algoritmin, joka suosittelee datan perusteella käyttäjiä kiinnostavia videoita.

Tiktokin ydin on algoritmin suosituksista muodostuva Sinulle-syöte (For You Page). Sovelluksen tyypillinen käyttötapa on nopeaa syötteen selaamista ja kiinnostavien videoiden katselua. Koska katselupäätökset tapahtuvat videoiden alkukuvan, otsikon ja alun perusteella, visuaalinen kiinnostavuus ja huomion herättäminen ovat keskeisessä roolissa. Tätä korostaa se, että Tiktokin algoritmi ei perustu monen muun somepalvelun tavoin siihen, mitä julkaisijoita käyttäjä on ottanut seurantaan, vaan siihen, mitä aiheita ja millaisia videoita käyttäjä on aiemmin katsonut.

Tiktokin mukaan videoiden suositteluun Sinulle-syötteessä vaikuttaa muun muassa seuraavat asiat: (24) (25)

  • Käyttäjän vuorovaikutukset: tykätyt, jaetut, kommentoidut, katsotut ja ohitetut videot sekä seuratut tilit. 
  • Videoiden tiedot: äänet, hashtagit, kuvaus­tekstit, katselumäärät ja julkaisumaat.
  • Käyttäjätiedot: laiteasetukset, kieli, sijainti, aikavyöhyke ja päivä sekä laitetyyppi.

Tiktok-sovelluksen datankeruu on vertailujen perusteella muihin somepalveluihin verrattuna hyvin laajaa. Tiktokin datankeräyksen voi jakaa viiteen tasoon oheisen kuvan mukaisesti: (26)

  1. Käyttäjän itsestään antamat tiedot.
  2. Käyttäjän muista ihmisistä antamat tiedot.
  3. Automaattisesti kerätyt tekniset tiedot.
  4. Muista lähteistä kerätyt tiedot.
  5. Datasta johdetut tiedot.

Käyttäjästä kerättyä dataa ja videoiden tietoja vertaamalla jokaiselle videolle määritellään sen todennäköinen kiinnostavuus käyttäjälle. Eri tekijöitä painotetaan eri tavoilla. Esimerkiksi videon katselu alusta loppuun on vahva indikaattori siitä, että käyttäjä on kiinnostunut tietyn aiheen sisällöistä. Pelkästään se, että julkaisijalla on paljon seuraajia, ei nosta hänen videoitaan suosittelujärjestelmässä muiden edelle. Sosiaalisella verkostolla eli seuraamissuhteilla ei ole suurta merkitystä Tiktokin algoritmin toiminnassa. Tiktokin algoritmia voi luonnehtia kiinnostusverkoston ohjaamaksi suosittelujärjestelmäksi.

Tiktokin algoritmi on hyvin reaktiivinen: käyttäjän toiminta alustalla vaikuttaa nopeasti hänelle jatkossa näytettäviin videoihin. Tämän ansiosta Tiktok on käyttäjilleen hyvin koukuttava. Vuonna 2024 Yhdysvalloissa Tiktokia vastaan nostetuista oikeuskanteista vuotaneiden yhtiön sisäisten asiakirjojen mukaan käyttäjät saattoivat koukuttua sovelluksen käyttöön 35 minuutissa sekä ajautua algoritmin luomaan suodatinkuplaan jo 20 minuutissa. (27)

Lyhytvideot kiinnostavat erityisesti nuoria

Tiktokin saavuttama maailmanlaajuinen suosio on määrittänyt viime vuosina sosiaalisen median palvelujen kehitysaskelia. Kuten useiden muiden somepalvelujen kohdalla, myös Tiktokin käyttäjämäärän kasvu perustui aluksi erityisesti lapsiin ja nuoriin, jotka omaksuivat pian uuden sovelluksen käytön.

Ennen Tiktokin yleistymistä nuorten suosituimmat sosiaalisen median palvelut olivat Suomessa ­Whatsapp, Youtube, Snapchat ja Instagram. ­Whatsappin ja Snapchatin suosio on perustunut pääasiassa käyttäjien välisiin pikaviesteihin ja ryhmiin, Youtuben videosisältöihin ja Instagramin kuvasisältöihin. Tiktokin lyhytvideot tarjosivat aiempiin somepalveluihin verrattuna uudenlaista sisältöä, ja se levisi suomalaisnuorten käyttöön nopeasti vuodesta 2019 lähtien. Vuoteen 2021 mennessä Tiktok oli jo 13-16-vuotiaiden keskuudessa käytetympi kuin Instagram ja tasoissa Snapchatin kanssa. Tiktokin tulo markkinoille ei silti näytä juuri vähentäneen muiden suosittujen somepalvelujen käyttöä nuorilla. (28)

Tiktokin suosio ei ole jäänyt muilta sosiaalisen median jäteiltä huomaamatta. Meta julkaisi ­Instagramin Reels-lyhytvideot elokuussa 2020 ja Youtuben Shorts-videot heinäkuussa 2021. Tiktokia voi pitää ­videopalveluna suurimpana haastajana juuri Instagramille ja Youtubelle - erityisesti nuorten käyttäjien keskuudessa. Siksi on ymmärrettävää, että ne pyrkivät tarjoamaan Tiktokia vastaavia lyhytvideoita.

Lyhytvideopalvelut ovat muuttaneet ja muuttavat edelleen sosiaalisen median käyttötottumuksia. Tämä näkyy esimerkiksi siinä, että lyhytvideoista on tullut vain muutamassa vuodessa monissa maissa suositumpi uutisten seurantamuoto kuin pitkistä videoista tai suorista videolähetyksistä. Reuters instituutin tutkimuksen (2024) mukaan uutisvideoita katsotaan maailmanlaajuisesti eniten Youtuben, Facebookin, Instagramin ja Tiktokin kautta. Alle 35-vuotiaiden suosiossa ovat erityisesti Instagram ja Tiktok. ­Tiktokin merkitys uutiskanava korostuu myös globaalin etelän maissa. (29)

Uutisten seurantaan liittyy kysymys, onko eri kanavien kautta saatujen uutisten luotettavuudessa eroa. Useiden kyselyjen mukaan Tiktokin käyttäjät kokevat usein sen kautta saadut uutiset epäluotettaviksi. Reuters instituutin kyselyssä Tiktokissa uutisten luotettavuuden varmistamista pidettiin useimmin vaikeana. Sen jälkeen sijoittuivat X, Facebook ja Instagram. Suomen osalta tulokset olivat samansuuntaisia kuin kyselyyn osallistuvissa maissa keskimäärin. (30)

Suomessa Tiktokin ja lyhytvideobuumin vaikutukset ovat näkyneet nopeasti. Vuoden 2024 alussa julkaistun kyselyn mukaan Tiktokista oli tullut 13–18-­vuotiaiden suomalaisnuorten suosituin uutiskanava ja 33 % koki saavansa sieltä kaiken tarvitsemansa uutistiedon. Toiseksi suosituin uutiskanava olivat iltapäivälehtien verkkosivut ja kolmanneksi Instagram. Valtaosa vastaajista (56 %) toivoi saavansa uutiset mieluiten lyhyinä ­videoina. (31) Kyse on nopeasta muutoksesta, jonka seurauksena nuorten mediankäyttö on hyvin erilaista kuin valtaosalla aikuisväestöä. On syytä olla huolissaan siitä, että Tiktokin käyttäjistä suhteellisesti suurin osuus (35 %) ei osannut sanoa, ovatko he kohdanneet alustalla disinformaatiota. (32) Tämä kertoo sekä nuorten sosiaalisen median käyttäjien digitaalisen informaatiolukutaidon tarpeesta että disinformaation havaitsemisen vaikeudesta juuri lyhytvideopalvelussa.

Dataohjattujen algoritmien valta kasvaa

Vaikka Tiktokin näkyvin vaikutus on lyhytvideoiden yleistyminen, on hyvä muistaa, että sen menestyksen salaisuus ei ole lyhytvideot sinänsä, vaan tehokas suosittelualgoritmi. Lisäksi kyse on siitä, kuinka suuressa osassa algoritmin sisältösuositukset ovat palvelun käytössä.

Tiktokin – ja sitä aiemmin myös Youtuben – menestys on osoittanut, että profilointiin ja kiinnostusverkostoon perustuva tekoälyä hyödyntävä suosittelualgoritmi saattaa olla tehokkaampi käyttäjien mielenkiinnon vangitsemisessa kuin sosiaaliseen verkostoon ja yhteistoiminnalliseen suodatukseen perustuva algoritmi. Tiktokin algoritmissa käyttäjien välisillä sosiaalisilla suhteilla ei ole juuri merkitystä. Tässä on merkittävä ero varsinkin Facebookin, Instagramin ja X:n (entisen Twitterin) algoritmeihin verrattuna, jotka ovat rakentuneet alun perin käyttäjien sosiaalisen verkoston varaan.

Meta on kertonut avoimesti suosittelualgoritmiensa kehityksestä. Vastauksena Tiktokin kilpailuun Meta on panostanut viime vuosina tekoälyn käyttöön muun muassa Instagram Reelsin eli kelojen algoritmissa. Vuoden 2021 alussa Meta kertoi kehittäneensä Reelsiä varten videoiden äänen ja kuvan analyysiin perustuvan jatkuvan itseohjautuvan oppimisen tekoälymallin.

Videoiden kuvan- ja puheentunnistuksen tulokset yhdistetään niiden otsikoiden ja kuvaustekstien analyysiin, jonka perusteella tekoälymalli pystyy muodostamaan aiempaa tarkempia videosuosituksia, jotka vastaavat käyttäjän kiinnostuksen kohteita. Tiktokin tapaan myös Instagram kerää huomattavan määrän profilointidataa eli käyttäjän toimintaan ­liittyviä signaaleja tämän mieltymysten päättelemiseksi. (33) (34)

Meta on lisännyt profilointidatan käyttöä myös Facebookin syötteen algoritmissa. Tämä näkyy siinä, algoritmin syötteeseen valitsemista julkaisuista yhä useampi on niin sanottuja yhdistämättömiä julkaisuja eli sellaisten julkaisijoiden tekemiä, joita käyttäjät eivät seuraa. Vielä vuonna 2021 vain noin 12 % syötteen julkaisuista oli keskimäärin ei-seuratuilta tahoilta, mutta vuonna 2024 lukema oli noussut jo noin 32 %:iin. Samalla varsinkin Facebook-kavereiden julkaisuja näytetään syötteessä yhä vähemmän. Toisin sanoen käyttäjien valinnoilla ja sosiaalisilla suhteilla on yhä vähemmän vaikutusta siihen, mitä julkaisuja he Facebookissa näkevät. (35)

On kiinnostava kysymys, missä määrin somepalvelujen algoritmit vastaavat käyttäjien tarpeisiin. Erään vastauksen tähän tarjoaa Taylorin ja Choin tutkimus, jossa selvitettiin, miten eri somepalvelujen sisältö vastasi käyttäjien henkilökohtaisia toiveita. Osallistujat arvioivat Facebookin, Instagramin, Twitterin ja Tiktokin algoritmien toimintaa yhteensä 15 väitteen perusteella.

Kahdeksan väitteistä liittyi algoritmin toivottuun toimintaan ja seitsemän ei-toivottuun. Tulosten perusteella Tiktokin algoritmin valitseman sisällön katsottiin vahvistavan ja vastaavan osallistujien tavoitteita useammin kuin Facebookin, Instagramin ja Twitterin. Facebookin algoritmin koettiin tarjoavan eniten käyttäjien tavoitteita vastaamattomia suosituksia. Tutkimus tehtiin vuosina 2021–2022. eli ennen kuin Facebook lisäsi ei-seurattujen julkaisujen osuutta algoritmin tekemissä suosituksissa. (36) Toisaalta on hyvä huomata, että algoritmien toimintaan perustuvaan tutkimukseen osallistuminen edellyttää melko kehittynyttä algoritmitietoisuutta ja algoritmilukutaitoa, jotta osallistujat pystyvät vertailemaan algoritmien toimintaa eri sovelluksissa.

Suosittelualgoritmien kehityksen viime vuosien trendin voi tiivistää siten, että dataohjatut algoritmit saavat entistä suuremman sijan verrattuna sosiaalisesti ohjattuihin algoritmeihin. Tämän voi odottaa muuttavan sosiaalisen median käyttötapoja entisestään lähitulevaisuudessa. Samalla dataohjatut tekoälypohjaiset algoritmit tulevat vaikuttamaan yhä voimakkaammin miljardien sosiaalisen median käyttäjien toimintaan niin yksilö- kuin yhteisötasolla. (37)

Tekoälyä hyödyntävät hyperpersonoidut suosittelualgoritmit merkitsevät sitä, että käyttäjien sijasta algoritmeilla on yhä suurempi valta siihen, mitä näemme eri sosiaalisen median palveluissa ja muilla digialustoilla. Loppujen lopuksi algoritmeja kehitetään alustojen omistajien tavoitteiden mukaan, ei käyttäjien. Toisaalta edellä mainittu eri somepalvelujen algoritmeja vertaileva tutkimus antaa viitteitä siitä, että dataohjatut algoritmit voivat vastata käyttäjien tarpeita paremmin kuin sosiaalisesti ohjatut.

Algoritmien sääntely puree huonosti 

Digialustojen vaikutukset käyttäjiin eivät rajoitu käyttökokemukseen sinänsä. Samalla on arvioitava esimerkiksi alustojen tekemän datankeräyksen vaikutusta yksityisyyteen, algoritmien suosittelemien sisältöjen totuudenmukaisuutta, kykyä torjua vahingollista sisältöä ja vihapuhetta sekä lopulta vaikutusta käyttäjien kokonaisvaltaiseen hyvinvointiin. Tähän liittyy myös monet EU:n  asetukset kuten yleinen tietosuoja-­asetus (GDPR), digipalveluasetus (DSA) ja tekoälyasetus (AI act). Vuodesta 2018 lähtien sovelletulla tietosuoja-asetuksella on ollut vaikutuksia siihen, miten digijätit keräävät ja käyttävät käyttäjien dataa. Esimerkiksi Meta ja Tiktok ovat saaneet satojen miljoonien eurojen GDPR-sanktiot lasten henkilötietojen käsittelyyn liittyvien puutteiden vuoksi. (38)

Digipalveluasetuksen soveltaminen alkoi helmikuussa 2024, ja se toi digitaalisten palvelujen käyttäjille useita uusia oikeuksia. Asetus kieltää mainosten kohdentamisen erityisten henkilötietojen kuten terveys­tietojen, poliittisten mielipiteiden, etnisen alkuperän tai vakaumuksen perusteella. Lisäksi alaikäisille ei saa kohdistaa mainoksia profiloinnin perusteella. (39)

Digipalveluasetus edellyttää, että verkkopalvelut kertovat avoimesti niiden suosittelujärjestelmien toiminnasta. Tietoa eri somepalvelujen algoritmien toiminnasta onkin saatavilla runsaasti tietoa. Samalla on todettava, että tieto on monilta osin puutteellista ja sattumanvaraista. Esimerkiksi Meta julkaisee runsaasti tietoa algoritmien toimintaperiaatteista, mutta vaikkapa Instagramin ja Threadsin syötteiden painoarvoista ja toteutuneista sisältömääristä ei juuri kerrota. Algoritmien toimintaa selvittäville valaisevimpia tietolähteitä ovat edelleen tietovuodot, tutkimukset ja käytännön eksperimentit. 

Digipalveluasetus toi suurille verkkoalustoille velvollisuuden tarjota suosittelujärjestelmälle vaihtoehto, joka ei perustu käyttäjien profilointiin. Oheiseen taulukkoon on koottu yhteenveto Facebookin, Instagramin, Youtuben, Tiktokin ja X:n algoritmien normaalista toiminnasta sekä niiden tarjoamista vaihtoehdoista profilointiin perustuvalle algoritmille.

Esimerkiksi Youtuben käyttö onnistuu edelleen kohtalaisen kätevästi ottamalla seurantaan kiinnostavia tahoja. Samoin on Facebookin, Instagramin ja X:n suhteen: kaikissa niissä on mahdollista katsoa, mitä sosiaalinen verkosto on viime aikoina julkaissut. Sen sijaan Tiktokin vaihtoehto tekoälyn ohjaamalle Sinulle-syötteelle on outo: käyttäjälle näytetään silloin videoita, jotka ovat yleisesti suosittuja hänen alueellaan. (40) Käytännössä Tiktokin vaihtoehto on sattumanvarainen syöte, joka tuskin kiinnostaa ketään. Näin se täyttää DSA:n vaatimuksen, mutta hyöty käyttäjille lähestyy nollaa.

Tiktok on muutenkin varoittava esimerkki sovelluksesta, joka sanoo julkisesti täyttävänsä digipalvelu­asetuksen vaatimukset, mutta jonka käytännön toimenpiteet eivät tarjoa käyttäjille niitä hyötyjä, joita asetuksella on tavoiteltu. Tiktokilla on ollut muun muassa isoja puutteita laittoman sisällön poistamisessa ja alaikäisten käyttäjien estämisessä. Lisäksi digipalveluasetuksen avoimuusvaatimukset ovat jokseenkin hyödyttömiä, mikäli yhtiön laatimien raporttien totuudenmukaisuutta ei voida varmistaa. (41)

Lähteet

(1) Wikipedia. (28.12.2024). Recommender system, https://en.wikipedia.org/w/index.php?title=Recommender_system&oldid=1265732754

(2) Wikipedia. (12.12.2024). Collaborative filtering, https://en.wikipedia.org/w/index.php?title=Collaborative_filtering&oldid=1262596993

(3) TikTok. (19.6.2020). How TikTok recommends videos #ForYou, https://newsroom.tiktok.com/en-gb/how-tiktok-recommends-videos-foryou-eu

(4) McGee, M. (16.8.2013). EdgeRank Is Dead, Facebook’s News Feed Algorithm Now Has Close To 100K Weight Factors, https://martech.org/edgerank-is-dead-facebooks-news-feed-algorithm-now-has-close-to-100k-weight-factors/

(5) Facebook. (27.4.2009). Facebook press room, saatavissa Archive.org-palvelun kautta, https://web.archive.org/web/20090427160416/http://www.facebook.com//press//info.php?statistics

(6) Wallaroo. (2024). Facebook News Feed Algorithm History, viitattu 9.12.2024, https://wallaroomedia.com/facebook-newsfeed-algorithm-history/#one

(7) McGee, M. (16.8.2013). EdgeRank Is Dead: Facebook’s News Feed Algorithm Now Has Close To 100K Weight Factors, https://martech.org/edgerank-is-dead-facebooks-news-feed-algorithm-now-has-close-to-100k-weight-factors/

(8) McGee, M. (16.8.2013). EdgeRank Is Dead: Facebook’s News Feed Algorithm Now Has Close To 100K Weight Factors, https://martech.org/edgerank-is-dead-facebooks-news-feed-algorithm-now-has-close-to-100k-weight-factors/

(9) Pönkä, H. (31.8.2016). Facebook meni rikki, https://harto.wordpress.com/2016/08/31/facebook-meni-rikki/

(10) Pönkä, H. (31.10.2021). Infografiikka: Facebookin viha-reaktio ja algoritmin muutokset, https://harto.wordpress.com/2021/10/31/infografiikka-facebookin-viha-reaktio-ja-algoritmin-muutokset/

(11) Owen, L. (15.4.2019). One year in, Facebook’s big algorithm change has spurred an angry, Fox News-dominated — and very engaged! — News Feed, https://www.niemanlab.org/2019/03/one-year-in-facebooks-big-algorithm-change-has-spurred-an-angry-fox-news-dominated-and-very-engaged-news-feed/

(12) Knuutila, A. & Laaksonen, S-M. (2020). Viraali vihaisuus ja tahmea nauru: tunteet ja algoritmit digitaalisessa vaalikampanjoinnissa, julkaisussa S Borg, E Kestilä-Kekkonen & H Wass (toim), Politiikan ilmastonmuutos: Eduskuntavaalitutkimus 2019. Oikeusministeriön julkaisuja. Selvityksiä ja ohjeita , Nro 2020:5, Oikeusministeriö, https://julkaisut.valtioneuvosto.fi/handle/10024/162429

(13) Meta. (2024). Facebook Transparency Center, Widely viewed content report: What People See on Facebook, Q3 2024, viitattu 11.12.2024, https://transparency.meta.com/fi-fi/data/widely-viewed-content-report/

(14) Baluja, S., Seth, R., Sivakumar, D., Jing, Y., Yagnik, J., Kumar, S., Ravichandran, D. & Aly, M. (2008). Video suggestion and discovery for youtube: taking random walks through the view graph, https://static.googleusercontent.com/media/research.google.com/fi//pubs/archive/34407.pdf

(15) Wikipedia. (28.12.2024). Recommender system, https://en.wikipedia.org/w/index.php?title=Recommender_system&oldid=1265732754

(16) Youtube. (4.12.2009). Automatic Captioning in YouTube, https://research.google/blog/automatic-captioning-in-youtube/

(17) Le, Q. V. (2013). Building high-level features using large scale unsupervised learning, https://ieeexplore.ieee.org/document/6639343

(18) Youtube. (15.9.2021). On YouTube’s recommendation system, https://blog.youtube/inside-youtube/on-youtubes-recommendation-system/

(19) YouTube. (n.d.). Videosuositukset: Miten YouTuben suositusjärjestelmä toimii?, viitattu 11.12.2024, https://www.youtube.com/intl/ALL_fi/howyoutubeworks/product-features/recommendations/#signals-used-to-recommend-content

(20) Wikipedia. (31.12.2024). TikTok, https://en.wikipedia.org/w/index.php?title=TikTok&oldid=1266416079

(21) Wikipedia. (7.9.2024). Toutiao, https://en.wikipedia.org/w/index.php?title=Toutiao&oldid=1244468033

(22) Wikipedia. (26.12.2024). Snapchat, https://en.wikipedia.org/w/index.php?title=Snapchat&oldid=1265349499

(23) Wikipedia. (21.11.2024). Vine (service), https://en.wikipedia.org/w/index.php?title=Vine_(service)&oldid=1258710466

(24) TikTok. (19.6.2020). How TikTok recommends videos #ForYou, https://newsroom.tiktok.com/en-gb/how-tiktok-recommends-videos-foryou-eu

(25) TikTok. (n.d.). Näin TikTok suosittelee sisältöä, viitattu 15.12.2024, https://support.tiktok.com/fi/using-tiktok/exploring-videos/how-tiktok-recommends-content

(26) Pönkä, H. (29.4.2024). Uusi selvitys TikTokin riskeistä ja raportti TikTokin Kiina-yhteyksistä, https://harto.wordpress.com/2024/04/29/uusi-selvitys-tiktokin-riskeista-ja-raportti-tiktokin-kiina-yhteyksista/

(27) NPR. (11.10.2024). TikTok executives know about app’s effect on teens, lawsuit documents allege, https://www.npr.org/2024/10/11/g-s1-27676/tiktok-redacted-documents-in-teen-safety-lawsuit-revealed

(28) DNA. (n.d.). koululaistutkimukset vuosilta 2017-2024, viitattu 28.12.2024, https://corporate.dna.fi/medialle/dnan-tutkimukset/

(29) Reuters Institute. (2024). Digital News Report 2024, https://reutersinstitute.politics.ox.ac.uk/digital-news-report/2024

(30) Reuters Institute. (2024). Digital News Report 2024, https://reutersinstitute.politics.ox.ac.uk/digital-news-report/2024

(31) Uutismedian liitto. (29.1.2024). Uutisten viikon tutkimus: Tiktok on noussut nuorten tärkeimmäksi uutiskanavaksi, kiinnostus omaan elämään liittyviin uutisiin kasvussa, https://www.uutismediat.fi/ajankohtaista/uutisten-viikon-tutkimus-tiktok-on-noussut-nuorten-tarkeimmaksi-uutiskanavaksi-kiinnostus-omaan-elamaan-liittyviin-uutisiin-kasvussa/

(32) Grönlund, M., Horowitz, M. & Lehtisaari, K. (22.1.2024). Luottamusta rakentamassa, luottamusta kokemassa: Mediapäättäjien ja journalismin yleisöjen näkemyksiä, DECA-hanke, https://cdn.prod.website-files.com/64123799970e0ddca93c317a/65af9e00c156d47a2e021807_Luottamusta%20rakentamassa%2C%20luottamusta%20kokemassa_taitettu_FINAL.pdf

(33) Meta. (12.3.2021). Learning from videos to understand the world, https://ai.meta.com/blog/learning-from-videos-to-understand-the-world/

(34) Meta. (13.12.2024). Instagram Reels Chaining -tekoälyjärjestelmä, https://transparency.meta.com/features/explaining-ranking/ig-reels-chaining/

(35) Meta. (2024). Facebook Transparency Center, Widely viewed content report: What People See on Facebook, Q3 2024, viitattu 11.12.2024, https://transparency.meta.com/fi-fi/data/widely-viewed-content-report/

(36) Taylor, S. H. & ja Choi, M. (2022). An Initial Conceptualization of Algorithm Responsiveness: Comparing Perceptions of Algorithms Across Social Media Platforms, https://journals.sagepub.com/doi/10.1177/20563051221144322

(37) Stone, S. (19.10.2023). Mastering Social Media Algorithms: The Interest Graph vs the Social Graph, https://www.theshelf.com/the-blog/social-media-algorithms-interest-graph-vs-social-graph/

(38) CMS Law.Tax. (n.d.). GDPR Enforcement Tracker, viitattu 30.12.2024, https://www.enforcementtracker.com/

(39) Euroopan komissio. (n.d.). EU:n digipalvelusäädös, viitattu 30.12.2024, https://commission.europa.eu/strategy-and-policy/priorities-2019-2024/europe-fit-digital-age/digital-services-act_fi

(40) Sitra. (3.4.2024). Näin kytket suosittelualgoritmit pois päältä suurissa some-palveluissa, https://www.sitra.fi/artikkelit/nain-kytket-algoritmit-pois-paalta-suurissa-somepalveluissa/

(41) Pönkä, H. & Mikko, S. (28.10.2024). Mitä hyötyä digipalvelusäädöksestä on diginatiiville? Tarkastelussa Tiktok, Faktabaari

edu@faktabaari.fi

Evästeet

Käytämme sivustollamme yksityisyyden suojaavaa analytiikkaa palveluidemme parantamiseksi.

Lue lisää tietosuoja käytännöistämme täältä.