Usein kysytyt kysymykset
Tältä sivulta löydät vastaukset seuraaviin kysymyksiin:
- Mitä tarkoittaa "tweeps"?
- Miten Tweeps.net toimii? (Ja miten ei?)
- Miksi saan virheilmoituksen "Rajapinnan rajoitus tuli vastaan"?
- Miten bottianalyysi tapahtuu?
- Miksi kaikkia seuraajia tai seurattavia ei analysoida?
- Mitä asioita twiiteistä analysoidaan?
- Mitä bottipisteet tarkoittavat?
- Miten bottipisteitä tulisi tulkita?
- Mitä tarkoittavat trollibotti, spämmibotti, muu botti, trollaaja, spämmääjä ja epäselvä?
- Mitä twiitit/tunnit-kuva tarkoittaa?
- Mikä on seuraajien verhokuva?
- Kuka Tweeps.net-palvelun on tehnyt?
Mitä tarkoittaa "tweeps"?
Yksikkömuodossa tweep tarkoittaa englanninkielessä X:n (aiemmin Twitterin) käyttäjää. (lähde: Cambridge Dictionary)
Tweeps on monikkomuoto, joka tarkoittaa joko X:n käyttäjiä tai tietyn käyttäjän seuraajia X:ssä. (lähde: Lexico)
Miten Tweeps.net toimii? (Ja miten ei?)
Tweeps.net pyrkii tunnistamaan botit pääasiassa kahdella periaatteella:
- Konemaisen toiminnan perusteella
- Ihmiskäyttäjille epätyypillisen toiminnan perusteella
Tweeps.net EI tunnista botteja seuraavilla perusteilla, koska ne eivät siihen sovellu:
- Suosittujen käyttäjien seuraamisen perusteella (koska X suosittelee heitä automaattisesti uusille käyttäjille)
- Passiivisuuden perusteella (koska näyttöä automaattisesta toiminnasta ei silloin voi olla)
- Profiilikuvan puuttumisen perusteella (vaikkakin tämä tieto näytetään muilla perusteilla boteiksi tunnistettujen kohdalla)
Lyhyesti: bottien tunnistaminen tapahtuu X-tunnusten toiminnan perusteella, eikä bottipisteisiin vaikuta profiilin ulkoiset seikat.
Miksi saan virheilmoituksen "Rajapinnan rajoitus tuli vastaan"?
Jos saat "Rajapinnan rajoitus tuli vastaan" -virheilmoituksen, kyse on siitä, että X:n rajapinta (API) estää toistaiseksi tietojen haun käyttäjistä. Tämän virheen pitäisi poistua itsestään odottamalla muutama minuutti.
Kirjautumalla omalla X-käyttäjätunnuksellasi voit tehdä tiheämmin useampia hakuja.
Miten bottianalyysi tapahtuu?
Tweeps.netin bottianalyysi tapahtuu seuraavissa vaiheissa:
- Haetaan haetun käyttäjän seuraajat tai seurattavat.
- Haetaan seuraajien tai seurattavien profiilitiedot.
- Pyritään ennustamaan profiilitietojen perustella ns. epäilyttävät käyttäjät. Tässä käytetään aiemmin tehtyä korrelaatioanalyysiä, minkä tyyppiset käyttäjät saavat todennäköisimmin bottipisteitä. Lisäksi huomioidaan aiemmin boteiksi todetut (yli 2 bottipistettä).
- Haetaan epäilyttävien käyttäjien twiitit (200 viimeisintä).
- Analysoidaan epäilyttävien käyttäjien twiitit. Bottipisteet lasketaan tässä vaiheessa. Bottipisteitä saa siis vain twiiteistä eli käyttäjän aktiivisesta toiminnasta.
Samalla huomioidaan seuraavat asiat:
- Käyttäjätunnuksen bännäys X:n hakutoiminnosta
- Käyttäjätunnuksen jäädyttäminen eli estäminen X:n toimesta. Nämä ovat tunnuksia, jotka usein poistetaan myöhemmin.
- Käyttäjien väliset estot (blokkaukset)
- Suojattuja tunnuksia ei voida analysoida, jos analyysin tekijä ei ole kyseisen käyttäjän seuraajakseen hyväksymä
Miksi kaikkia seuraajia tai seurattavia ei analysoida?
Tweeps.net operoi X:n ohjelmistorajapinnan (API:n) kanssa. Rajapinnassa on hakumäärän rajoitus per 15 minuuttia. Tämän takia kaikkia seuraajia tai seurattavia ei voida hakea, jos niitä on esimerkiksi kymmeniä tuhansia. Tai voisi, mutta se veisi hyvin pitkän ajan.
Toiseksi: twiittien analyysi tehdään vain, jos epäilyttävällä käyttäjällä on vähintään 200 twiittiä. Näin tehdään siksi, jotta otos olisi riittävän suuri ajatellen tulosten luotettavuutta.
Kolmanneksi analysoitavien käyttäjien määrää on rajoitettu keinotekoisesti, jotta analyysi ei kestäisi liian kauaa. Analyysi on pyritty kohdentamaan niihin, jotka saavat todennäköisesti eniten bottipisteitä. Ei olisi kovin kiinnostavaa käydä läpi sadoittain 1-2 pisteen mahdollisia botteja.
Mitä asioita twiiteistä analysoidaan?
Tweeps.net laskee bottipisteitä noin 20 tunnusluvun perusteella, jotka perustuvat mm. seuraaviin:
- Twiittaustunnit, eli monelleko eri vuorokauden tunnille analysoidun käyttäjän twiitit sijoittuvat.
- Twiittaustunneissa tunnistetut kaavamaisuudet
- Aktiivisuus, twiittien määrä per tunti
- Monelleko päivälle käyttäjän analysoidut twiitit sijoittuvat
- Twiittien pituudet
- Twiittien tyypit: tavalliset, vastaukset, lainaukset ja retwiitit
- Twiiteissä olevat linkit, kuvat ja videot
- Twiiteissä olevat #hashtagit
- Twiiteissä olevat muiden käyttäjien @maininnat (olematta vastaustwiitti)
- Twiittien sisältöjen samankaltaisuus
- Twiittien julkaisuun käytetyt X-sovellukset
Mitä bottipisteet tarkoittavat?
Bottipisteet jakaantuvat seuraaviin tyyppeihin:
Twiittien ajankohdissa on ihmiselle epätavallista säännöllisyyttä tai keskittymistä tietyille tunneille.
Käyttäjä on twiitannut ympäri vuorokauden ainakin kerran edellisen viikon aikana.
Twiitit eivät jakaannu pitkin päivää, vaan sijoittuvat vain harvoille tunneille.
Twiittausajat näyttävät noudattavan ainakin osittain toistuvaa kaavaa.
Twiittausaktiivisuus on epätavallisen suuri.
Twiitit sisältävät epätavallisen usein muiden käyttäjien mainintoja niin, että kyse ei ole vastauksista. Tämä voi viitata häirintään.
Twiitit ovat epätavallisen usein vastauksia muiden käyttäjien twiitteihin.
Twiitit sisältävät epätavallisen paljon kuvia ja/tai videoita.
Twiitit sisältävät epätavallisen paljon linkkejä.
Twiitit sisältävät epätavallisen paljon hashtageja.
Twiitit ovat epätavallisen suurelta osin retwiittejä.
Twiitit sisältävät epätavallisen paljon muiden twiittien lainauksia (quote). Tämä voi viitata maalittamiseen.
Twiitit muistuttavat sisällöiltään useiden muiden käyttäjien twiittejä. Tämä viittaa siihen, että käyttäjä on osa spämmikampanjaa.
Käyttäjä jakaa usein linkkejä X:n tunnistamaan sensitiiviseen sisältöön. Sisältövaroitus.
Twiittien pituus on usein suunnilleen sama.
Twiitit toistavat usein samaa sisältöä.
Retwiitit toistavat usein samaa sisältöä.
Twiittien julkaisussa on käytetty automaattisesti toimivaa X-sovellusta, jota ei pidetä epäilyttävänä.
Twiittien julkaisussa on käytetty automaattisesti toimivaa X-sovellusta, jota pidetään epäilyttävänä.
Lisäksi näytetään seuraavat merkinnät, mutta ne eivät vaikuta bottipisteisiin:
Käyttäjällä on oletusprofiilikuva eikä hän ole muuttanut profiilisivunsa ulkoasua.
X on tunnistanut käyttäjän jakamissa linkeissä sensitiivistä sisältöä. Sisältövaroitus.
Käyttäjä on bännätty X:n hausta. Käyttäjän twiitit eivät siis näy hakutoiminnossa.
Miten bottipisteitä tulisi tulkita?
Bottipisteet eivät kerro suoraan, onko käyttäjä oikeasti botti vai ei. Tämä johtuu siitä, että joskus ihmisetkin toimivat kaavaimaisella tai muuten boteille tyypillisellä tavalla. Korkeiden bottipisteiden tapauksessa epäselvyyttä ei pitäisi olla, mutta puhumme "mahdollisista boteista". Alla on tulkintaohje.
- 1-2 pistettä: Ei ole varmuutta, onko käyttäjä ihminen vai botti. Syynä voi olla esimerkiksi epätavallisen suuri aktiivisuus tai retwiittien määrä.
- 3-4 pistettä: Käyttäjä on joko botti tai ihminen, jonka twiittaustoiminta on poikkeuksellista. Selityksenä voi olla esimerkiksi spämmäys ja twiitien keskittyminen vain harvoille vuorokauden tunneille.
- 5-10 pistettä: Käyttäjätunnus on tyypillinen mahdollinen botti. Pisteet selittyvät usealla eri tekijällä kuten aktiivisuudella, twiitaustuntien kaavamaisuudella, spämmisisällöllä tai toistuvalla sisällöllä.
- Yli 10 pistettä: Kyse on hyvin selvästi todennäköisestä botista.
Bottipisteiden lisäksi kannattaa katsoa myös twiitit/tunnit-kuvaaja.
Mitä tarkoittavat trollibotti, spämmibotti, muu botti, trollaaja, spämmääjä ja epäselvä?
Jokaisen bottipisteitä saaneen X-tunnuksen kohdalla näytetään algoritmin tekemä automaattinen tulkinta, joka perustuu bottipisteiden tyyppeihin.
Automaattinen tulkinta bottipisteistä voi olla jokin seuraavista: trollibotti, spämmibotti, automaattinen sovellus, bottisovellus, muu botti, trolli tai spämmääjä. Jos bottipisteitä on liian vähän tulkinnan tekemiseksi, näytetään teksti "epäselvä".
Bottipisteiden tyypit vaikuttavat tulkintaan seuraavan taulukon mukaisesti:
Bottipisteiden tyypit | Ihminen | Sosiaalinen botti | |
- | Muu botti | ||
+ | Automaattinen sovellus/ Bottisovellus |
||
+ | Spämmääjä | Spämmibotti | |
+ | Trolli | Trollibotti |
Mitä twiitit/tunnit-kuva tarkoittaa?
Bottipisteiden lisäksi haetuista käyttäjistä ja mahdollisista boteista näytetään twiitit/tunnit-kuva. Kyse on ns. polarchart-kuvaajasta. Tässä on esimerkki:
Kuvaaja esittää, miten käyttäjän julkaisemat analyysissä mukana olevat twiit ovat jakaantuneet eri vuorokauden tunneille. Sektori 0 tarkoittaa klo 0-1 välillä julkaistuja twiittejä, sektori 2 klo 2-3 välillä julkaistuja twiittejä ja niin edelleen. Kuva siis kertoo, mihin aikaan käyttäjä on twiitannut.
Esimerkiksi yllä olevassa kuvassa käyttäjä on twiitannut kaikki analyysissä mukana olleet 200 twiittiään klo 21-22 välillä. Tavallisesti ihmiskäyttäjien twiitit jakaantuvat eri vuorokauden tunneille.
Kuvan alla kerrotaan, kuinka monelle päivälle analyysissä mukana olleet 200 twiittiä sijoittuvat, sekä miltä päivältä on viimeisin julkaistu twiitti. Näistä tiedoista voi päätellä, kuinka aktiivinen käyttäjä on viime aikoina ollut.
Boteille on tavallista, että twiitit keskittyvät joko harvoille tai tietyille tunneille. Seuraavassa on esimerkkejä, joista voi osasta helposti havaita säännönmukaisen kaavan twiittien julkaisuajoissa:
Mikä on seuraajien verhokuva?
Seuraajien verhokuva esitetään bottianalyysin lopussa. Tässä on esimerkki:
Kuvassa olevat pisteet ovat haetun käyttäjän seuraajia. Pystyakseli kuvaa seuraajien X-tunnusten luontipäivää ja vaaka-akseli seuraamisjärjestystä. Haetun käyttäjän viimeiset seuraajat ovat kuvaajassa oikealla ja ensimmäiset vasemmalla.
Tästä kuvasta voi joskus päätellä paljonkin, mutta seuraavassa pääasiat:
- Punaiset pisteet ovat analyysin perusteella mahdollisia botteja eli käyttäjiä, jotka saivat bottianalyysissä vähintään yhden pisteen
- Tavallisesti bottien voi odottaa jakaantuvan vaaka-akselin suunnassa tasaisesti. Jos botteja on jossakin kohtaa runsaasti, on haettu käyttäjä saanut kyseisessä vaiheessa tavallista enemmän mahdollisia bottiseuraajia.
- Tavallisesti käyttäjät saavat tasaisesti uusia seuraajia, jotka ovat liittyneet X:ään äskettäin. Kuvaajan voi siksi odottaa nousevan tasaisesti.
- Muutokset kuvaajan "kulmakertoimessa" kertovat muutoksesta uusien seuraajien kertymisen nopeudessa.
- Mikäli haetun käyttäjän havaittiin saaneen epätavallisen runsaasti uusia seuraajia, jotka ovat liittyneet X:ään samalla päivällä, ne näytetään kuvaajassa vihreinä pisteinä, joiden selitys on "liittymispäivän vuoksi epäilyttävät".
- Tiettyinä vuosina X:ään on liittynyt enemmän käyttäjiä kuin toisina vuosina. Tällaiset vuodet voivat erottua verhokuvassa pisteiden tihentyminä vaakasuunnassa.
- X on poistanut pavelusta tuhansittain trolli- ja bottikäyttäjiä. Tämän seurauksena verhokuvassa voi olla jaksoja, joissa seuraajien pisteitä on harvemmassa kuin muissa kohdissa. Tällainen voi luonnollisesti erottua vain käyttäjillä, joilla on hyvin paljon seuraajia.
Kuka Tweeps.net-palvelun on tehnyt?
Palvelun tekijä ja ylläpitäjä on Tweeps Oy, jonka kotipaikka on Oulu. Bottianalyysityökalun on kehittänyt Harto Pönkä (@hponka). Taustalla on pitkä kokemus X-analyysien teosta ja bottien toimintaan perehtymisestä.