Twitter-mining mit R – Teil 5 – Followermap

Mit nur wenigen Zeilen R-Code ist es möglich, die globale Verteilung der Follower eines Accounts zu Visualisieren. Dies geht besonders einfach, wenn man eine Funktion zur Hilfe nimmt, die auf folgender Homepage veröffentlicht wurde http://simplystatistics.org/2011/12/21/an-r-function-to-map-your-twitter-followers/.

Zwei Dinge sollten bedacht werden:

  • Viele Twitter-User tragen aus Datenschutzgründen keinen, oder einen falschen Standort ein
  • Visualisierungen wie diese Followermap bilden häufig nur die variiernde Bevölkerungsdichte bzw. die variierende Dichte des Internetzugangs über die Weltregionen ab

Randell Munroe von XKCD bringt das Problem mit einem Comic treffend auf den Punkt:
XKCD.com

#-----------------------------------------------------
# --- Mit Twitter verbinden ---
#-----------------------------------------------------
library(twitteR)
# Authentifizierungsschlüssel eingeben
api_key <- "**************************"
api_secret <- "***************************"
access_token <- "*****************************"
access_token_secret <- "******************************"
setup_twitter_oauth(api_key,api_secret,access_token,access_token_secret)

#Followermap-Funktion laden
source("http://biostat.jhsph.edu/~jleek/code/twitterMap.R")

#Followermap-Funktion ausführen (erstellt ein PDF)
twitterMap("OfficialSanta",nMax=2000,plotType="followers",userLocation="Anchorage",fileName="Weihnachtsmann-Follower.pdf")

Das Ausführen dieser Funktion kann etwas länger dauern (durchaus einige Minuten). Es müssen schließlich die Koordinaten von bis zu 2000 Accounts abgefragt werden. Nach einiger Wartezeit erhält man eine solche Grafik:

Als Wohnsitz von Santa Claus wurde der North Pole in Alaska bei Fairbanks gewählt bzw. die nächstgrößte Stadt Anchorage.

Als Wohnsitz von Santa Claus wurde der North Pole in Alaska bei Fairbanks gewählt bzw. die nächstgrößte Stadt Anchorage.