Digital Humanities Lab

Blog

Donald Trump en tekstanalyse

Door José de Kruif  —   

Een fraai voorbeeld van tekstanalyse met Twitter als bron verscheen een week of twee geleden op het blog Variance.org. De hypothese: Als Donald Trump een tweet verstuurt met een prettige toonzetting, is die afkomstig van een lid van zijn campagneteam. Als hij daarentegen een tweet verstuurt waarin hij zijn gebruikelijke narrige taal over of tegen een medemens bezigt, is deze sneer afkomstig van Trump zelf. Inventarisaties van de tijdlijn van Donald Trump lijken deze aanname te bevestigen. De beledigingen waren afkomstig van een Android en een wervende tweet was steevast verzonden van een Iphone. Inderdaad gebruikt Trump een Samsung Galaxy.

David Robinson zocht het uit. Met behulp van twitteR package maakte hij een bestand van 628 Iphone tweets en 762 Android dito’s. De Androidbezitter houdt er kennelijk een ouderwetse manier van retweeten op na: copy-paste, aanhalingstekens en voilà. En als er een plaatje is ingekopieerd, is het meestal de Iphone. Want de Iphone doet de voor een campagneteam typerende aankondigingen van bijeenkomsten en dergelijke.

Echt leuk wordt het als Robinson verslag doet van de resultaten van vergelijking van woordkeuze en sentiment analyse met het tidytext package. De Androïd verstuurt de emotioneel geladen woorden (“crazy”, “weak”, “dumb”).  Algemeen komt de meerderheid van de negatieve lading van de Androïd. Overigens hadden verschillen in positieve termen tussen de twee accounts geen significant effect. Al met al interessante datajournalistiek. Hier na te lezen. Tijd om een duik te nemen in de R-pakketten die Robinson gebruikt. Hierover later meer.