Koeporauksia eurovaaliteemoihin Twitter-datan avulla

Kuva: M. B. M. / Unsplash (CC0)
Lukuaika: 6 min. 

Twitterin tarjoaman aineiston louhiminen antaa kuvaa eurovaalien teemoista. Samalla avautuu ikkuna datapohjaiseen digitaalisen politiikan tutkimukseen.

Euroopan parlamentin vaalit huipentuvat sunnuntaina, 26. toukokuuta 2019, jolloin kymmenillä miljoonilla äänioikeutetuilla on mahdollisuus valita edustajansa vaalikauden 2019–2024 parlamenttiin.

Kokonaiseurooppalainen asetelma tekee vaaleista kiinnostavat myös digitaalisen politiikan (digital politics) näkökulmasta. Niin Facebook kuin Twitter ovat olleet viime vuosina toistuvasti vilkkaan julkisen keskustelun kohteena muun muassa vaalivaikuttamisen takia.

Sosiaalisen median vaikutus perustuu ensisijaisesti sen kykyyn tavoittaa nopeasti, jopa reaaliaikaisesti, suuria kohderyhmiä. Tämä ”viraalisuudeksi” nimetty ilmiö on kiinnostanut tutkijoita, koska sillä on nähty olevan koko poliittista viestintää muuttava luonne. Viestinnän tutkijoiden mukaan erityisesti Twitteristä näyttäisi muodostuneen reaaliaikainen yhteiskunnallisten tapahtumien kommentointipaikka.

Kokonaiseurooppalainen asetelma tekee vaaleista kiinnostavat myös digitaalisen politiikan näkökulmasta.

Vaalikamppailujen viimeiset viikot ovat yleensä viestinnällisesti intensiivisintä aikaa, koska etenkin epävarmat äänestäjät toivovat saavansa viestinnästä tukea ja apua äänestyspäätökselleen.

Tarkastelenkin tämän ajatuksen pohjalta englanninkielistä, eurovaaleihin liittyvää Twitter-viestintää aikavälillä 22.4.–17.5.2019. Aikaikkuna päättyy noin viikkoa ennen virallista vaalipäivää. Kyseiselle ajanjaksolle osuvat kuitenkin Eurooppa-päivä ja Brysselissä 15.5. järjestetty Euroopan komission puheenjohtajaehdokkaiden eli kärkiehdokkaiden vaaliväittely. Se televisioitiin kaikkiin Euroopan unionin maihin, ja esimerkiksi Suomen eduskuntavaaleista jo tiedetään, että televisioidut vaaliväittelyt näkyivät merkittävinä piikkeinä Twitter-keskusteluissa.

Lyhyeen artikkeliin on mahdutettu kolme datapohjaista analyysiä, joista ensimmäinen tarkastelee yleistä tviittausaktiivisuutta ja toinen keskittyy aihetunnisteiden (hashtag) käyttöön tarkastelujakson eri viikkoina. Viimeinen analyysi perustuu viikoittaisten teemojen tarkempaan analysointiin tekstinlouhintamenetelmää soveltamalla.

Twitter-pöhinän tematiikan esiin nostamisen lisäksi artikkeli toimii myös ikkunana datapohjaiseen digitaalisen politiikan tutkimukseen.

Tutkimusdataa Twitteristä

Artikkelissa analysoitu data on kerätty osana laajempaa, kevään 2019 eduskunta- ja eurovaaleihin liittyvää tutkimushanketta. Eurovaalidataa olen striimannut Twitterin ohjelmointirajapinnan (API) kautta maaliskuun alusta lähtien, ja keruuprosessi on tarkoitus päättää 2–3 viikkoa vaalien jälkeen, hieman vaalituloksesta riippuen.

Itse keruu tapahtuu Python-ohjelmointikielellä toteutetun pienen ohjelman avulla, joka striimaa Twitteriä suodattaen sieltä tutkimustietokantaan tviitit, joissa esiintyy jokin seuraavista aihetunnisteista: #epelections2019, #euelections2019, #ep2019, #euvaalit2019, #euvaalit19 tai #thistimeimvoting.

Suomalaiset versiot aihetunnisteista otin mukaan striimaukseen, koska yksi osa hanketta keskittyy juuri kotimaiseen EU-keskusteluun Twitterissä. Muun keskustelun osalta päätin rajautua käyttämään EU-tasolla virallisesti käytettyjä tunnisteita.

Toki on selvää, että valituilla aihetunnisteilla osa kansallisin kielin ja aihetunnistein käydystä keskusteluista jää aineiston ulkopuolelle. Mutta koska kiinnostus kohdistuu ensisijaisesti yleiseurooppalaiseen debattiin, katsoin Euroopan lingua francan eli englannin olevan tässä suhteessa neutraalein vaihtoehto.

Eurovaalien alhainen tviittausaktiivisuus heijastelee mahdollisesti sekä vaaliväsymystä että julkisen eurovaalikeskustelun laimeutta.

Suomen osalta on todettava, että suomenkielisiä tai suomalaisille aihetunnisteille kohdistettuja tviittejä on vain noin 15 000, mihin sisältyvät myös uudelleentviittaukset, eivät vain alkuperäiset tviitit. Kun eduskuntavaalien osalta kerätyssä datassa oli noin puoli miljoonaa tviittiä, eurovaalien alhainen tviittausaktiivisuus heijastelee mahdollisesti sekä vaaliväsymystä että julkisen eurovaalikeskustelun laimeutta.

Analyysiä varten aineistosta suodatettiin englanninkieliset tviitit Twitter-dataan sisältyvän ”language”-muuttujan avulla. Data, kaikkiaan reilut 530 000 tviittiä – joista tosin vain reilut 83 000 alkuperäisiä – yhteensä rapialta 144 000 Twitter-käyttäjältä, siirrettiin taulukkomuotoisena R-tilasto-ohjelmistoon. Uudelleentviittausaktiivisuus osoittaa aiempien tutkimusten tuloksia vahvistaen, ettei eurovaalien tiimoilta juurikaan keskusteltu vaan lähinnä jaettiin informaatiota.

Mitä tviittausaktiivisuus paljastaa?

Kuva 1: Tviittausaktiivisuus eurovaalien aihetunnisteille englanninkielisissä tviiteissä ajalla 22.4.–17.5.2019 (tviittejä päivässä).

Tviittausaktiivisuus eurovaalien kohdalla noudattelee varsin hyvin muissa tutkimuksissa saatuja tuloksia. Kuvassa 1 näkyy, kuinka vaalipäivän lähestyminen korreloi hyvin tviittausaktiivisuuden lisääntymisen kanssa.

Samalla kuvaajaan merkityt pystyviivat vahvistavat näkemystä, että aiheen kannalta merkittävät tapahtumat tai muut sellaiset aiheuttavat jonkinlaisia piikkejä aktiivisuuteen. Vasemmalta katsoen ensimmäinen pystyviiva on Eurooppa-päivä, jälkimmäinen puolestaan televisioitu kärkiehdokkaiden väittely.

Twitterissä aktiivisuuden vaihtelut ovat nopeita molempiin suuntiin.

Oletukseen piikistä liittyy myös se kuviossakin selvästi havaittava seikka, että Twitterissä aktiivisuuden vaihtelut ovat nopeita molempiin suuntiin. Sekä Eurooppa-päivän että televisioidun vaaliväittelyn jälkeen tviittausmäärät putosivat nopeasti.

Erityisen nopeasti putosi alkuperäisten tviittien määrä. Uudelleentviittausten kohdalla havaittava pieni viive on aivan normaali ”Twitter-kaiku”. Kärkiehdokkaiden väittely sijoittui lisäksi niin myöhäiseen iltaan, että uudelleentviittausten sijoittuminen seuraavalle päivälle on täysin luonnollinen asia.

Digitaalisen politiikan kannalta kiinnostava kysymys liittyy siihen, voidaanko aihetunnisteiden avulla saada käsitystä keskustelun teemojen vaihtelusta. Tässä lähtökohtana on ajatus aihetunnisteiden hierarkkisuudesta, joka samalla korreloisi aihetunnisteen temaattisen kattavuuden kanssa.

Striimauksessa käytetyt aihetunnisteet ovat catch all -aihetunnisteita, eli ne pyrkivät tavoittamaan laajasti vaaleihin liittyvää Twitter-viestintää. Samassa tviitissä mahdollisesti esiintyvien muiden aihetunnisteiden oletetaan täsmentävän tviitin tematiikkaa.

Yleispoliittisten teemojen alla käydään aina myös rajatumpia keskusteluja.

Koska Twitter on perusluonteeltaan ”anarkistinen” media, jossa aihetunnisteet luovat rakenteita kiinnittämällä tviittejä jo aiemmin sanottuun, käyttäjät de facto luovat politiikan tiloja käyttämällä poliittisesti latautuneita aihetunnisteita.

Tätä taustaa vasten voidaan ajatella, että varustamalla – tietoisesti – tviittinsä eurovaaleihin liittyvällä aihetunnisteella käyttäjä haluaa tuoda viestinsä juuri tähän politiikan tilaan. Mutta kuten muillakin politiikan foorumeilla, yleispoliittisten teemojen alla käydään aina myös rajatumpia keskusteluja. Jos tulkinnan apuna käytetään Kari Palosen politisointi-käsitettä, kertoo poliittisesti tägätty tviittaus samalla käyttäjän päätöksestä tuoda tviitti osaksi Twitterin poliittista keskustelua.

Kattavat ja kapeammat aihetunnisteet

Tägäyksen tulkitseminen poliittiseksi teoksi johtaa kaksiportaiseen tulkintaan aihetunnisteiden käytöstä. Catch all -aihetunniste määrittää poliittisen yleiskeskustelun tilan – tässä siis eurovaalit – ja muut käytetyt aihetunnisteet täsmentävät, mihin alateemaan tai -teemoihin tviitti ensisijaisesti kontribuoi.

Tukea tämä lähestymistapa saa myös viimeaikaisista tutkimuksista, joissa aihetunnisteiden yhteisesiintymien perusteella on vähintäänkin kohtuullisen luotettavasti pystytty kaivamaan esiin tietyn yleisen aihetunnisteen alle syntyneitä, temaattisesti toisistaan poikkeavia alakeskusteluja.

Kuva 2: Seurannassa olleille vaaliaihetunnisteille kohdistettujen englanninkielisten tviittausten viisitoista yleisintä aihetunnistetta viikoittain eroteltuna aikavälillä 22.4.–17.5.2019. Seurannassa olleita aihetunnisteita ei ole huomioitu.

Kuvassa 2 on esitetty viisitoista catch all -tunnisteiden kanssa eniten käytettyä muuta aihetunnistetta jaoteltuna tarkastelujakson eri viikoille. Kuvaaja siis esittää, mitkä aihetunnisteet olivat kullakin viikolla yleisimmin käytössä vaalit-aihetunnisteiden rinnalla.

Jo näinkin suppea, viidentoista yleisimmän aihetunnisteen tarkastelu antaa hämmästyttävän selkeän kuvan niistä teemoista, jotka ovat hallinneet Twitter-viestintää, mutta myös keskustelun temaattisesta muutoksesta tarkastelujaksolla.

Brexit näyttää viikosta toiseen dominoivan Twitter-keskustelun tematiikkaa.

Ainakin itselleni hieman yllättäen brexit näyttää viikosta toiseen dominoivan Twitter-keskustelun tematiikkaa. Osin tätä saattaa selittää rajautuminen englanninkielisiin tviitteihin – joskin myös tarkastelujaksolle osunut päätös, että Britannian tulee osallistua eurovaaleihin horisontissa odottavasta EU-erostaan huolimatta, lienee merkittävä selittäjä.

Tästä huolimatta varsinaisten EU-teemojen puuttuminen on hämmentävää. Itse vaalien asiakysymyksistä kärkijoukkoon murtautuvat vain Maastrichtissa viikolla 18 käyty vaaliväittely (#maastrichtdebate) sekä Eurooppa-päivä (#europeday) ja ilmastoteemaan liittyvä #votegreen2019 viikolla 19.

Jälkimmäisen kohdalla kyse näyttää olevan viesteistä, joissa kannustetaan äänestämään eurovaaleissa vihreiden edustajia, jos haluaa vaikuttaa ilmastonmuutokseen. Havainto kertoo viestittelijöiden luottamuksesta mahdollisuuksiin vaikuttaa EU-politiikan suuntaan juuri äänestämisen kautta.

Vaikka #votegreen2019-aihetunniste kytkee keskusteluja ilmastoteemaan, muita Euroopan laajuista ilmastokeskustelua tägääviä aihetunnisteita ei kärkijoukosta löydy. Vertailtuna Suomen eduskuntavaalien Twitter-viestintään havainto on hieman yllättävä: #ilmastovaalit-aihetunnisteesta muodostui yksi eduskuntavaalikeskustelun kestoteemoista Twitterissä.

Kohinan peittämät teemat

Koska brexit-kohina näyttää peittävän alleen muut teemat, kokeilin myös vaihtoehtoista tf-idf-menetelmää (term frequency, inverse document frequency), jota käytetään laajasti tekstianalyysissä. Dataamme sovellettuna ajatus oli lisätä sellaisten aihetunnisteiden painoarvoa, jotka olivat tyypillisiä tietyn viikon Twitter-viestinnälle, ja vastaavasti vähentää tarkasteluaikaa läpilyövästi dominoivien aihetunnisteiden painoarvoa.

Kuva 3: Tf-idf-analyysiin perustuva aihetunnisteiden viikottainen yleisyys, 15 yleisintä aihetunnistetta aikavälillä 22.4.17.5.2019. Seurannassa olleita aihetunnisteita ei ole huomioitu.

Kuten kuva 3 osoittaa, näin kustomoitu analyysi onnistuu kaivamaan esiin brexit-kohinan taakse peittyviä teemoja.

Viikolla 17 keltaliivi-tematiikka näyttää olleen korostuneesti esillä (#yellowjacket, #yellowshirt). Maastrichtin vaaliväittely puhutti jo edeltävällä viikolla, mutta nousi kärkiteemojen joukkoon viikolla 18 (#maastrichtdebate). Samalle viikolle osuneet vappu (#internationalworkersday) ja lehdistönvapauden päivä (3.5., #worldpressfreedomday) nousevat myös viikon 18 kärkiteemojen joukkoon.

Viikolla 19 Eurooppa-päivä (#europeday) nousee itseoikeutetusti kärkiteemaksi. Samalle viikolle osunut uutisointi Nigel Faragen perustaman brexit-puolueen suuresta kannatuksesta näkyy kyseisten viikkojen keskustelutematiikassa (#voteukip, #imvotingukip, #bxp).

Viikolla 19 järjestetty tv-väittely onnistuu myös kipuamaan kyseisen viikon kärkiteemojen joukkoon, joskin hieman yllättäen saksalaisperäisellä #tvduell-aihetunnisteella.

Mitä koeporauksista voidaan päätellä?

Euroopan unionin kannalta historialliseksi määritellyt eurovaalit ovat odotetusti näkyneet myös Twitter-viestinnässä. Tätä kirjoitettaessa kerätyn datan määrä on rikkonut jo miljoonan tviitin rajan, jos huomioidaan koko aika maaliskuun alusta toukokuun puoliväliin.

Datamäärä on suuri verrattuna eduskuntavaalien vastaavaan määrään. Jos sen kuitenkin suhteuttaa yhtäältä EU:n väestöpohjaan ja toisaalta keskusteluilmapiirin polarisoitumiseen, ei tviittausaktiivisuutta voi pitää mitenkään poikkeuksellisena. Vastaavan määrän tviittejä keräsin Saksan liittopäivävaalien yhteydessä vuonna 2017. Niiden Twitter-vuorovaikutusta analysoiva tutkimusartikkeli on tällä hetkellä työn alla.

Twitteriä tarkoituksenmukaisesti louhimalla on mahdollista havainnoida poliittisen keskustelun hienovireisiä ja piileviä rakenteita sekä näissä tapahtuvia muutoksia.

Twitteriä tarkoituksenmukaisesti louhimalla on mahdollista havainnoida poliittisen keskustelun hienovireisiä ja piileviä rakenteita sekä näissä tapahtuvia muutoksia. Itse näen tämän tulevan korostuneesti esille juuri brexit-kohinan alle jäävien teemojen esiin louhinnassa. Vaikka brexit on varsin läpileikkaava teema myös eurovaaleissa, viikoittaisiin teemoihin on mahdollista päästä kiinni oikeilla työkaluilla.

Tutkijana alleviivaan kuitenkin lopuksi, että melko laajasta data-aineistosta huolimatta artikkeli tarjoaa vain yhden näkökulman eurovaaleihin. Lisäksi kehotan suhtautumaan Twitter-keskustelujen edustavuuteen eurooppalaisen mielipideilmaston suhteen terveellä skeptisyydellä – yksinomaan jo siksi, että Twitterin käyttäjäkunta ei edusta koko väestöä kattavasti.

Kuitenkin on ilmeistä, että nyt esitetyn tyyppisillä datalähtöisillä menetelmillä on mahdollista nostaa esille politiikan tutkimuksen ja politiikan ilmiöiden kannalta kiinnostavia havaintoja, jotka osaltaan tarkentavat kuvaamme digitaalisesta politiikasta.

Dosentti Kimmo Elo on Turun yliopiston eduskuntatutkimuksen keskuksen Eurooppa-tutkimuksen erikoistutkija. Hän toimii tällä hetkellä myös Tarton yliopiston digitaalisten tutkimusmenetelmien vierailevana opettajana.

Jätä kommentti

Sähköpostiosoitettasi ei julkaista.


*