Tarkoituksena oli tunnistaa kevään 2017 kuntavaalien aikana vähemmistöihin ja heikossa asemissa oleviin kohdistettua vihapuhetta.
Mainos

Joukko tietojenkäsittelyn, median ja viestinnän tutkijoita ja soveltajia toteutti kevään 2017 kuntavaalien aikana vihapuheen tunnistamiskampanjan, jossa käytettiin apuna koneoppimiseen perustuvaa algoritmia.

Kampanjan aluksi algoritmia opetettiin tunnistamaan vihapuhetta. Algoritmi oppi laskennallisesti vertailemaan, mikä erottaa vihapuhetta sisältävän tekstin ei-vihapuheesta, ja kehittämään luokittelujärjestelmän vihapuheelle. Tämän jälkeen luokittelujärjestelmän avulla seulottiin päivittäin kaikki kunnallisvaaliehdokkaiden tuottama avoin sisältö Facebookissa ja Twitterissä noin kuukautta ennen vaaleja. Ehdokkaiden tilit saatiin kerättyä Ylen vaalikoneaineiston avulla.

Ymmärtämisvaikeuksia

Seurannassa tuli esiin muutamia haasteita. Luokittelujärjestelmällä oli vaikeuksia suomen kielen sanamuotojen kanssa. Algoritmilla on lisäksi ihmistä rajoittuneempi kyky tulkita keskustelun tai kommentoinnin kontekstia.

Päätöksen tekemiseen tarvitaan ihminen

Mainos

Vihapuheen tunnistamisen lisäksi keskeinen kysymys on se, mitä jatkotoimenpiteitä tunnistetuista viesteistä seuraa. Algoritmi kykenee toimimaan valtavien aineistojen seulojana, joka tuo esiin epäilyttäviä viestejä, mutta vain ihminen voi tehdä lopulliset päätelmät vaadittavista toimenpiteistä.

”Viranomaisnäkökulmasta toimenpiteitä aiheutti korkeintaan 20 viestiä. Sanojen listaus ei sinänsä ole riittävää, koska merkitys tulee niiden yhdistelystä. Toisaalta meillä ei taas olisi resursseja näin mittavaan seurantaan ilman vihapuhekoneen ja tutkijoiden apua”, kertoo yhdenvertaisuusvaltuutettu Kirsi Pimiä.

Tunteet ja uskomukset korostuvat vihapuheessa

”Viestejä luokitellessa tutkija joutuu ottamaan kantaa kieleen ja kontekstiin, minkä vuoksi algoritmin opettamiseen käytettävää aineistoa on tärkeää käsitellä useamman tulkitsijan voimin”, sanoo Salla-Maaria Laaksonen Helsingin yliopistosta.

Somesta ongelma

Vihapuhetta on aina ollut olemassa. Sitä on aina tuotettu pönkittämään oman ryhmän asemaa ja syrjimään toisia, mutta sosiaalinen media on tehnyt siitä aikaisempaa näkyvämpää. Tunteisiin perustuva ilmaisu ja uskomukset korostuvat, ja niitä myös kierrätetään verkossa. Jos ehdokas esimerkiksi kampanjan aikana poisti kirjoituksensa nopeasti julkaisemisen jälkeen, se saattoi silti jäädä elämään kuvakaappauksena”, kuvailee Reeta Pöyhtäri Tampereen yliopistosta.

Kaikki vihainen puhe ei ole lain näkökulmasta rangaistavaa vihapuhetta, vaan sen tulee esimerkiksi kohdistua heikommassa asemassa oleviin ryhmiin, olla syrjivää tai sisältää uhkauksen väkivallasta. Hankkeessa käytettiin Euroopan neuvoston sekä Ethical Journalism Networkin rakentamaa vihapuhemääritelmää (TÄSSÄ)

Valvojan valta kasvaa

Salla-Maaria Laaksosen mukaan sosiaalisen median palvelut ja alustat, kuten Facebook ja Twitter, voisivat halutessaan hyödyntää vihapuheen tunnistamista ja vaikuttaa sillä tavoin verkon käyttäjien toimintaan.

”Muulla tavoin automaattista tunnistamista ei voida ulottaa yksittäisten kansalaisten tasolle.”

Kampanjan aikana tehty työ jatkuu konferenssissa, jonka internettutkijoiden järjestö järjestää 18.–21. lokakuuta Tartossa.

Lähde: Aalto-yliopisto

UUTISSUORA