集計」タグアーカイブ

[twitter]立憲民主党のフォロワーについて追加調査

ググろうとすると検索候補に「デマ」と出るnetgeekが、こんな記事を出していた。

立憲民主党のフォロワーが急減。取り締まり強化で不正アカウントが消された結果 | netgeek

まあコレ自体は、グラフの縦軸を拡大しているからそう見えるだけというグラフ詐欺みたいなものなんだけど、それはそれとしても昨年10月に急激に増えたフォロワー達は結局まだ大半残ってるんだろうかと気になったので、追加調査してみた。

手元に残っているデータは2017年10月8日0時頃のデータのみなので、この時点のフォロワーと現時点のフォロワーで比較する。この2017年10月8日時点の立憲民主党フォロワーに、捨てアカウントの大量購入のような形跡が無い事は、これこの調査で説明済みである。フォロワーに「ツイート数ゼロ」が大挙して押し寄せるという謎現象はあるにはあったが、それが発生する直前のデータだ。

念のため「ツイート数ゼロ」が突然押し寄せた事を示すグラフを再掲する。

ご覧の通り、16万番目あたりのフォロワーから急に「ツイート数ゼロ」フォロワーの流入数が激増しているが、今回用いるのは15万8千あたりで取得したデータになる。(※2)

尚、個人的見解としてはこの「ツイート数ゼロ」の大量流入は、スパムに狙われたか、あんなに捨てアカウントを購入しているぜと指摘する為の嫌がらせ目的だろうと考えている。既に「健全な」アカウント16万近くを集めて自民党広報アカウントよりフォロワーが増えているところに、こんなバレバレな工作を立憲民主党自身が行う理由などないからだ。

さて、それでは昨年10月8日時点のフォロワーが何人抜けて、それ以外が何人流入して今の状態になっているのか。概要を調べてみると以下の通りであった。比較対象として、「自民党広報」アカウントのフォロワーも載せている。

◆立民
2017年10月8日のフォロワー数:158,174
 ↓
アカウント削除or凍結(※1):1,719
フォロー解除:22,988
新規フォロー:45,140
 ↓
2018年2月24日のフォロワー数:178,609
※差し引き2だけあわないがAPIの取得エラーと思われる、影響軽微とみてこのまま進める

◆自民
2017年10月8日のフォロワー数:117,398
 ↓
アカウント削除or凍結(※1):1,409
フォロー解除:3,813
新規フォロー:26,412
 ↓
2018年2月24日のフォロワー数:138,588

どちらも2万ほどフォロワー増加しているが内容はかなり異なっている。立憲民主党は新規フォロー数の多さでカバーしているものの、フォロー解除数が自民より6倍ほど多い。

netgeekは「不正アカウントの減少により」と断じているが、いや確かにツイート数ゼロのアカウントも消えていってはいるのだろうけど、現在のジリジリ減少している要因はどうもそれだけではなさそうだ。やはり急激に増えたフォロワーというものは、離れるのも早いのかもしれない。

「立憲民主党のフォローを解除したアカウント」の22,988について、最終ツイート日を円グラフにした。

多くが今年に入ってからもツイートしており、フォロー解除したのもアクティブなアカウント達であることがわかる。

では、初期の15万8千アカウントのうち、残った者と解除した者の違いは何かあるだろうか?
どう調べたら良いかわからなかったが、各アカウントの「自己紹介欄」のテキストを収集し、出現する単語を比較してみた。(※3)


1つ目が「フォロー解除したアカウント」の自己紹介欄、2つ目が現在も「継続してフォローしているアカウント」の自己紹介欄だ。
政治的な色彩が特に濃いと思われる単語を黄色くしてみた。

なんとなくではあるが、当初の熱狂でフォローした人達の中から無党派寄りの人達がより多く抜けているのかもしれない。
これを「繋ぎ止められるようにしないとダメだ」と考えるか、「一時の熱狂の結果だからそうなるのは仕方ない」と考えるかは分かれる所ではないだろうか。

例によってこの記事はtoggeterにも纏めようと思う。

[補足]
※1…機械的に見分ける方法が思いつかなかったので「凍結」も一緒の項目にしたが、いくつか手動でユーザのページを確認したところ、ほぼ「アカウント削除」であった。
※2…データを削除してしまったのだが、10月21日の時点で、この時の「ツイート数ゼロ」アカウントの半分以上はフォロワーから消えていたのを確認している。
※3…使用ソフトはお馴染みKHCoder

[時事ネタ]立憲民主フォロワーの呟きを眺めながら衆院選を振り返る

些か時期を逸してしまいましたが。せっかくtwitterのAPIを叩いてデータを収集できるようになったので、今度はそのデータを使ってテキストマイニングの真似事でもしてみました。

対象は立憲民主党フォロワーのツイート。この1月半ほどの目まぐるしい政局の中、彼らは一体どんな言葉を発していたのか眺めながら衆院選を振り返ってみたいと思います。

■概要

<収集内容>
・10/21(土) 16:00 頃の立憲民主党フォロワー116,179人
※全185,915人中、非公開アカウント、ツイート数ゼロアカウントを除いた全て
・リツイートを除くツイートを集計
・全てを集計する時間もマシンパワーも無い為、期間を区切った上でその10%をランダム抽出して集計する

<使用ツール>
・テキストマイニングツール : KH Coder 3
樋口耕一氏によるフリーソフト。
ダウンロードした一式さえあればMeCab(や茶筌)、R、MySQLなど全部使える状態になっており、ツイートのデータを投入するだけで、形態素解析から共起ネットワークのグラフ作成など出来てしまえる素晴らしいソフトです。

<データの収集と集計のだいたいの流れ>
①TwitterAPIを自作Pythonスクリプトを使って、フォロワーのツイートを収集
②収集したjson構造のデータをそのままMongoDBに入れる
③MongoDBからリツイートデータを除外した対象期間のツイートをファイルに順次出力
④KH Coder の機能を使って各ファイルから10%ランダム抽出して集計
⑤何度か集計しながら単語の取捨選択
⑥最終的に共起ネットワークグラフ完成

続きを読む

[時事ネタ]立憲民主党のフォロワー数激増の話で調べてみた

本気でそう思ってる人がどれだけいるのかわかりませんが、立憲民主党のフォロワー数が激増している事から「フォロワーを金で買ってるのでは」みたいな陰謀めいた言いがかりをつけてる人がいるらしい。

そのあたりに対する反論として、既にBuzzFeedNewsが十分な検証をしていた。

【検証】立憲民主党Twitter「フォロワーを購入」は本当か? 急成長で自民党を抜いたけれど…

偽アカウントや、活動していないアカウントの割合が立憲民主党だけ突出しているとは言えない。

立憲民主党だけを何らかのツールを使って調べ、「フォロワーを買っている」という記事は根拠がないと言える。

この記事中で紹介されている、twitterのアカウント診断ツール「Fake Follower Check」「twitteraudit」というのがなかなか凄いが、何十万ものフォロワーがいるものをどうやって調べているんだろう。

ちょっと調べてみるとtwitterにはユーザ情報など出力してくれるAPIが用意されているそうで、それをアレコレして判定してるんだな、きっと。
ちょっと興味が出てきたのと、3連休と時間もあるし、ここは一つ勉強がてらtwitterのフォロワー情報を知らべてみようとこの2日間頑張ってみたので、集計結果をメモしておく。
(あとでtoggeterにも纏めて、反応があるかみてみよう)

続きを読む