Usein kysytyt kysymykset

Tältä sivulta löydät vastaukset seuraaviin kysymyksiin:

Mitä tarkoittaa "tweeps"?

Yksikkömuodossa tweep tarkoittaa englanninkielessä X:n (aiemmin Twitterin) käyttäjää. (lähde: Cambridge Dictionary)

Tweeps on monikkomuoto, joka tarkoittaa joko X:n käyttäjiä tai tietyn käyttäjän seuraajia X:ssä. (lähde: Lexico)

Miten Tweeps.net toimii? (Ja miten ei?)

Tweeps.net pyrkii tunnistamaan botit pääasiassa kahdella periaatteella:

Konemaisen toiminnan perusteella
Ihmiskäyttäjille epätyypillisen toiminnan perusteella

Tweeps.net EI tunnista botteja seuraavilla perusteilla, koska ne eivät siihen sovellu:

Suosittujen käyttäjien seuraamisen perusteella (koska X suosittelee heitä automaattisesti uusille käyttäjille)
Passiivisuuden perusteella (koska näyttöä automaattisesta toiminnasta ei silloin voi olla)
Profiilikuvan puuttumisen perusteella (vaikkakin tämä tieto näytetään muilla perusteilla boteiksi tunnistettujen kohdalla)

Lyhyesti: bottien tunnistaminen tapahtuu X-tunnusten toiminnan perusteella, eikä bottipisteisiin vaikuta profiilin ulkoiset seikat.

Miksi saan virheilmoituksen "Rajapinnan rajoitus tuli vastaan"?

Jos saat "Rajapinnan rajoitus tuli vastaan" -virheilmoituksen, kyse on siitä, että X:n rajapinta (API) estää toistaiseksi tietojen haun käyttäjistä. Tämän virheen pitäisi poistua itsestään odottamalla muutama minuutti.

Kirjautumalla omalla X-käyttäjätunnuksellasi voit tehdä tiheämmin useampia hakuja.

Miten bottianalyysi tapahtuu?

Tweeps.netin bottianalyysi tapahtuu seuraavissa vaiheissa:

Haetaan haetun käyttäjän seuraajat tai seurattavat.
Haetaan seuraajien tai seurattavien profiilitiedot.
Pyritään ennustamaan profiilitietojen perustella ns. epäilyttävät käyttäjät. Tässä käytetään aiemmin tehtyä korrelaatioanalyysiä, minkä tyyppiset käyttäjät saavat todennäköisimmin bottipisteitä. Lisäksi huomioidaan aiemmin boteiksi todetut (yli 2 bottipistettä).
Haetaan epäilyttävien käyttäjien twiitit (200 viimeisintä).
Analysoidaan epäilyttävien käyttäjien twiitit. Bottipisteet lasketaan tässä vaiheessa. Bottipisteitä saa siis vain twiiteistä eli käyttäjän aktiivisesta toiminnasta.

Samalla huomioidaan seuraavat asiat:

Käyttäjätunnuksen bännäys X:n hakutoiminnosta
Käyttäjätunnuksen jäädyttäminen eli estäminen X:n toimesta. Nämä ovat tunnuksia, jotka usein poistetaan myöhemmin.
Käyttäjien väliset estot (blokkaukset)
Suojattuja tunnuksia ei voida analysoida, jos analyysin tekijä ei ole kyseisen käyttäjän seuraajakseen hyväksymä

Miksi kaikkia seuraajia tai seurattavia ei analysoida?

Tweeps.net operoi X:n ohjelmistorajapinnan (API:n) kanssa. Rajapinnassa on hakumäärän rajoitus per 15 minuuttia. Tämän takia kaikkia seuraajia tai seurattavia ei voida hakea, jos niitä on esimerkiksi kymmeniä tuhansia. Tai voisi, mutta se veisi hyvin pitkän ajan.

Toiseksi: twiittien analyysi tehdään vain, jos epäilyttävällä käyttäjällä on vähintään 200 twiittiä. Näin tehdään siksi, jotta otos olisi riittävän suuri ajatellen tulosten luotettavuutta.

Kolmanneksi analysoitavien käyttäjien määrää on rajoitettu keinotekoisesti, jotta analyysi ei kestäisi liian kauaa. Analyysi on pyritty kohdentamaan niihin, jotka saavat todennäköisesti eniten bottipisteitä. Ei olisi kovin kiinnostavaa käydä läpi sadoittain 1-2 pisteen mahdollisia botteja.

Mitä asioita twiiteistä analysoidaan?

Tweeps.net laskee bottipisteitä noin 20 tunnusluvun perusteella, jotka perustuvat mm. seuraaviin:

Twiittaustunnit, eli monelleko eri vuorokauden tunnille analysoidun käyttäjän twiitit sijoittuvat.
Twiittaustunneissa tunnistetut kaavamaisuudet
Aktiivisuus, twiittien määrä per tunti
Monelleko päivälle käyttäjän analysoidut twiitit sijoittuvat
Twiittien pituudet
Twiittien tyypit: tavalliset, vastaukset, lainaukset ja retwiitit
Twiiteissä olevat linkit, kuvat ja videot
Twiiteissä olevat #hashtagit
Twiiteissä olevat muiden käyttäjien @maininnat (olematta vastaustwiitti)
Twiittien sisältöjen samankaltaisuus
Twiittien julkaisuun käytetyt X-sovellukset

Mitä bottipisteet tarkoittavat?

Bottipisteet jakaantuvat seuraaviin tyyppeihin:

Konemainen

Twiittien ajankohdissa on ihmiselle epätavallista säännöllisyyttä tai keskittymistä tietyille tunneille.

Väsymätön

Käyttäjä on twiitannut ympäri vuorokauden ainakin kerran edellisen viikon aikana.

Kellontarkka

Twiitit eivät jakaannu pitkin päivää, vaan sijoittuvat vain harvoille tunneille.

Kaavamainen

Twiittausajat näyttävät noudattavan ainakin osittain toistuvaa kaavaa.

Aktiivisuus

Twiittausaktiivisuus on epätavallisen suuri.

@-spämmi

Twiitit sisältävät epätavallisen usein muiden käyttäjien mainintoja niin, että kyse ei ole vastauksista. Tämä voi viitata häirintään.

vastausspämmi

Twiitit ovat epätavallisen usein vastauksia muiden käyttäjien twiitteihin.

Mediaspämmi

Twiitit sisältävät epätavallisen paljon kuvia ja/tai videoita.

Linkkispämmi

Twiitit sisältävät epätavallisen paljon linkkejä.

Hashtag-spämmi

Twiitit sisältävät epätavallisen paljon hashtageja.

RT-spämmi

Twiitit ovat epätavallisen suurelta osin retwiittejä.

Lainausspämmi

Twiitit sisältävät epätavallisen paljon muiden twiittien lainauksia (quote). Tämä voi viitata maalittamiseen.

Spämmikampanja

Twiitit muistuttavat sisällöiltään useiden muiden käyttäjien twiittejä. Tämä viittaa siihen, että käyttäjä on osa spämmikampanjaa.

K18-spämmi

Käyttäjä jakaa usein linkkejä X:n tunnistamaan sensitiiviseen sisältöön. Sisältövaroitus.

Toistuva pituus

Twiittien pituus on usein suunnilleen sama.

Toistuva sisältö

Twiitit toistavat usein samaa sisältöä.

Toistuva RT-sisältö

Retwiitit toistavat usein samaa sisältöä.

Automaattinen sovellus

Twiittien julkaisussa on käytetty automaattisesti toimivaa X-sovellusta, jota ei pidetä epäilyttävänä.

Epäilyttävä sovellus

Twiittien julkaisussa on käytetty automaattisesti toimivaa X-sovellusta, jota pidetään epäilyttävänä.

Lisäksi näytetään seuraavat merkinnät, mutta ne eivät vaikuta bottipisteisiin:

Oletusprofiili

Käyttäjällä on oletusprofiilikuva eikä hän ole muuttanut profiilisivunsa ulkoasua.

K18-sisältöä

X on tunnistanut käyttäjän jakamissa linkeissä sensitiivistä sisältöä. Sisältövaroitus.

Bännätty hausta

Käyttäjä on bännätty X:n hausta. Käyttäjän twiitit eivät siis näy hakutoiminnossa.

Miten bottipisteitä tulisi tulkita?

Bottipisteet eivät kerro suoraan, onko käyttäjä oikeasti botti vai ei. Tämä johtuu siitä, että joskus ihmisetkin toimivat kaavaimaisella tai muuten boteille tyypillisellä tavalla. Korkeiden bottipisteiden tapauksessa epäselvyyttä ei pitäisi olla, mutta puhumme "mahdollisista boteista". Alla on tulkintaohje.

1-2 pistettä: Ei ole varmuutta, onko käyttäjä ihminen vai botti. Syynä voi olla esimerkiksi epätavallisen suuri aktiivisuus tai retwiittien määrä.
3-4 pistettä: Käyttäjä on joko botti tai ihminen, jonka twiittaustoiminta on poikkeuksellista. Selityksenä voi olla esimerkiksi spämmäys ja twiitien keskittyminen vain harvoille vuorokauden tunneille.
5-10 pistettä: Käyttäjätunnus on tyypillinen mahdollinen botti. Pisteet selittyvät usealla eri tekijällä kuten aktiivisuudella, twiitaustuntien kaavamaisuudella, spämmisisällöllä tai toistuvalla sisällöllä.
Yli 10 pistettä: Kyse on hyvin selvästi todennäköisestä botista.

Bottipisteiden lisäksi kannattaa katsoa myös twiitit/tunnit-kuvaaja.

Mitä tarkoittavat trollibotti, spämmibotti, muu botti, trollaaja, spämmääjä ja epäselvä?

Jokaisen bottipisteitä saaneen X-tunnuksen kohdalla näytetään algoritmin tekemä automaattinen tulkinta, joka perustuu bottipisteiden tyyppeihin.

Automaattinen tulkinta bottipisteistä voi olla jokin seuraavista: trollibotti, spämmibotti, automaattinen sovellus, bottisovellus, muu botti, trolli tai spämmääjä. Jos bottipisteitä on liian vähän tulkinnan tekemiseksi, näytetään teksti "epäselvä".

Bottipisteiden tyypit vaikuttavat tulkintaan seuraavan taulukon mukaisesti:

Bottipisteiden tyypit		Ihminen	Sosiaalinen botti
Konemainen Väsymätön Kellontarkka Kaavamainen Aktiivisuus Toistuva pituus Toistuva sisältö Toistuva RT-sisältö		-	Muu botti
+	Automaattinen sovellus Epäilyttävä sovellus		Automaattinen sovellus/ Bottisovellus
+	Mediaspämmi Linkkispämmi Hashtag-spämmi RT-spämmi Spämmikampanja K18-spämmi	Spämmääjä	Spämmibotti
+	@-spämmi Lainausspämmi Vastausspämmi	Trolli	Trollibotti

Mitä twiitit/tunnit-kuva tarkoittaa?

Bottipisteiden lisäksi haetuista käyttäjistä ja mahdollisista boteista näytetään twiitit/tunnit-kuva. Kyse on ns. polarchart-kuvaajasta. Tässä on esimerkki:

Kuvaaja esittää, miten käyttäjän julkaisemat analyysissä mukana olevat twiit ovat jakaantuneet eri vuorokauden tunneille. Sektori 0 tarkoittaa klo 0-1 välillä julkaistuja twiittejä, sektori 2 klo 2-3 välillä julkaistuja twiittejä ja niin edelleen. Kuva siis kertoo, mihin aikaan käyttäjä on twiitannut.

Esimerkiksi yllä olevassa kuvassa käyttäjä on twiitannut kaikki analyysissä mukana olleet 200 twiittiään klo 21-22 välillä. Tavallisesti ihmiskäyttäjien twiitit jakaantuvat eri vuorokauden tunneille.

Kuvan alla kerrotaan, kuinka monelle päivälle analyysissä mukana olleet 200 twiittiä sijoittuvat, sekä miltä päivältä on viimeisin julkaistu twiitti. Näistä tiedoista voi päätellä, kuinka aktiivinen käyttäjä on viime aikoina ollut.

Boteille on tavallista, että twiitit keskittyvät joko harvoille tai tietyille tunneille. Seuraavassa on esimerkkejä, joista voi osasta helposti havaita säännönmukaisen kaavan twiittien julkaisuajoissa:

Mikä on seuraajien verhokuva?

Seuraajien verhokuva esitetään bottianalyysin lopussa. Tässä on esimerkki:

Kuvassa olevat pisteet ovat haetun käyttäjän seuraajia. Pystyakseli kuvaa seuraajien X-tunnusten luontipäivää ja vaaka-akseli seuraamisjärjestystä. Haetun käyttäjän viimeiset seuraajat ovat kuvaajassa oikealla ja ensimmäiset vasemmalla.

Tästä kuvasta voi joskus päätellä paljonkin, mutta seuraavassa pääasiat:

Punaiset pisteet ovat analyysin perusteella mahdollisia botteja eli käyttäjiä, jotka saivat bottianalyysissä vähintään yhden pisteen
Tavallisesti bottien voi odottaa jakaantuvan vaaka-akselin suunnassa tasaisesti. Jos botteja on jossakin kohtaa runsaasti, on haettu käyttäjä saanut kyseisessä vaiheessa tavallista enemmän mahdollisia bottiseuraajia.
Tavallisesti käyttäjät saavat tasaisesti uusia seuraajia, jotka ovat liittyneet X:ään äskettäin. Kuvaajan voi siksi odottaa nousevan tasaisesti.
Muutokset kuvaajan "kulmakertoimessa" kertovat muutoksesta uusien seuraajien kertymisen nopeudessa.
Mikäli haetun käyttäjän havaittiin saaneen epätavallisen runsaasti uusia seuraajia, jotka ovat liittyneet X:ään samalla päivällä, ne näytetään kuvaajassa vihreinä pisteinä, joiden selitys on "liittymispäivän vuoksi epäilyttävät".
Tiettyinä vuosina X:ään on liittynyt enemmän käyttäjiä kuin toisina vuosina. Tällaiset vuodet voivat erottua verhokuvassa pisteiden tihentyminä vaakasuunnassa.
X on poistanut pavelusta tuhansittain trolli- ja bottikäyttäjiä. Tämän seurauksena verhokuvassa voi olla jaksoja, joissa seuraajien pisteitä on harvemmassa kuin muissa kohdissa. Tällainen voi luonnollisesti erottua vain käyttäjillä, joilla on hyvin paljon seuraajia.

Kuka Tweeps.net-palvelun on tehnyt?

Palvelun tekijä ja ylläpitäjä on Tweeps Oy, jonka kotipaikka on Oulu. Bottianalyysityökalun on kehittänyt Harto Pönkä (@hponka). Taustalla on pitkä kokemus X-analyysien teosta ja bottien toimintaan perehtymisestä.