月別アーカイブ: 2017年10月

[時事ネタ]立憲民主フォロワーの呟きを眺めながら衆院選を振り返る

些か時期を逸してしまいましたが。せっかくtwitterのAPIを叩いてデータを収集できるようになったので、今度はそのデータを使ってテキストマイニングの真似事でもしてみました。

対象は立憲民主党フォロワーのツイート。この1月半ほどの目まぐるしい政局の中、彼らは一体どんな言葉を発していたのか眺めながら衆院選を振り返ってみたいと思います。

■概要

<収集内容>
・10/21(土) 16:00 頃の立憲民主党フォロワー116,179人
※全185,915人中、非公開アカウント、ツイート数ゼロアカウントを除いた全て
・リツイートを除くツイートを集計
・全てを集計する時間もマシンパワーも無い為、期間を区切った上でその10%をランダム抽出して集計する

<使用ツール>
・テキストマイニングツール : KH Coder 3
樋口耕一氏によるフリーソフト。
ダウンロードした一式さえあればMeCab(や茶筌)、R、MySQLなど全部使える状態になっており、ツイートのデータを投入するだけで、形態素解析から共起ネットワークのグラフ作成など出来てしまえる素晴らしいソフトです。

<データの収集と集計のだいたいの流れ>
①TwitterAPIを自作Pythonスクリプトを使って、フォロワーのツイートを収集
②収集したjson構造のデータをそのままMongoDBに入れる
③MongoDBからリツイートデータを除外した対象期間のツイートをファイルに順次出力
④KH Coder の機能を使って各ファイルから10%ランダム抽出して集計
⑤何度か集計しながら単語の取捨選択
⑥最終的に共起ネットワークグラフ完成

続きを読む

[アニメ]ジョジョの奇妙な冒険 1~3部

Netflixにてここ1ヶ月ほどかけて1~3部までを一気に視聴しました。
(尚、4部はリアルタイムでTV視聴済)

1部:9話
2部:17話
3部:48話

 

君が泣くまで殴るのをやめないっ!

やっぱり世代的にはJOJOサイコー!なんです!
数多名言を生みいまだJOJOのセリフはネタ・パロディとして使われ、当時能力バトルモノの頂点を極めたといえるアイデアの数々は、その後のあらゆる作品に多大な影響を与えたのは間違いない。

その名作に対し、類まれなる原作愛に溢れたアニメ化をしてくれたスタッフは素晴らしい仕事をしたと思います。
きっとスタッフの世代的にも、子供心にJOJOを毎週楽しみにしていた人が多かったんだろうね。

俺は人間をやめるぞ!ジョジョォォォッ!!

DIO・石仮面とジョースター一族の物語としては、1~3部できちんと完結するので、区切りとしてはすごくいい。
4部は4部でまた違った群像劇として大好きなんだけど、1~3部の主人公3世代に渡る物語は、激しく心の中の「ロマン」を揺さぶられるんだよね。
現実では2代目3代目が同じように大活躍、ってケースは少ないけど、それでもなにがしか活躍した例でいえば相撲でいう若貴とか、歴史でいう真田昌幸・幸村親子とか、世代の物語ってやっぱロマンじゃん?ロマンですよね?

このジョースター3世代のうち好きな主人公は世の中的には承太郎が一番だろうと思う。
けど自分としては2代目のジョセフかなあ。
あのよく喋る性格、飄々としながらばかしあいを制していくスタイルがたまらないんだよね。

ドイツの科学力はァァァァアアア世界一ィィィィィイイイ!

2部OP歌詞の「闇を欺いて刹那をかわして刃すり抜け奴らの隙を突け」ってフレーズは、正にジョセフ・ジョースターを表現している。
これ書いた人、世界一とまでは言わないけどいい仕事してるわ。
俺もそんなイカス男になりたかったものだw
しかし現実は非情であり、そんな器量も頭のキレも持ち合わせていない以上、彼のようなヒーローに憧れながら日々を地道に生きて行くしかないのである。

次にてめーは「これも計算のうちかジョジョ!」と言う(ビシィ!

相手を茶化すように挑発するジョセフと違って、承太郎は常にクールだ。
何か昔はもっと無口だったように記憶していたんだけど、アニメみたら結構しゃべってんのね。
オラオラとかオラオラとかオラオラばっかり記憶に残ってたw
あの恵まれた体躯でドンと静かに構えながらも、スタンドがオラオララッシュを決めるフィニッシュは、静と動両方のいいとこ取りした贅沢な一コマだと思う。

だが・・・マヌケは見つかったようだな

尺的には最も長い全48話の第3部。ほぼ一年ですよこれ。今時、連載中でもない過去作品を一年の長尺で放映できるって凄い事だ。1部2部の円盤がかなり売れたおかげって事もあんだろうけど、やっぱり一番人気の第3部に対する期待も大きかったんだろう。
そして長いのに途中でダレる事もなくあっという間に最後まで見きってしまえる、ほんとに48話もあったの?ってくらい、夢中になれた。
毎回毎回、能力バトルのアイデアもキャラから絞り出される魅力も、敵味方揃って最高なんです。

あ・・・ありのまま今起こった事を話すぜ!

能力の見せ方の幅が狭かった波紋に比べると、「スタンド」というギミックはいくらでも個性的な能力をぶっ込めるようになった。
毎回驚くようなアイデアの「スタンド」との能力バトルは、観てるこっちが「頭がどうにかなりそう」な、ポルナレフ状態にされてしまいながら楽しめる。
スタッフもこの原作の魅力を十分に再現してて「JOJOは愛されてるなあ」と、その愛され具合によってこっちまで幸せな気分になってくるのもこのアニメ作品の魅力だと思う。
オインゴ・ボインゴの歌をEDで再現したり、OPでびっくりするようなネタを仕込んでみたり、細かいところまでよく作りこんであるので、うっかりスキップできないくらいだ。

 

やれやれだぜ

こんな最高のアニメが格安でネット視聴できるなんて、良い時代になったものだ。

 

個人的評価:★★★★★

[映画]22年目の告白-私が殺人犯です-

7月に映画館で視聴。
それが10月4日にもうBD/DVDリリースしていたそうで・・・最近は早いねえ。
昔は映画館で観てもらう為に、もっと映画公開から期間を空けてからメディア販売していたように記憶してるんだけど。

wikipediaよりあらすじ
1995年、東京で起きた5件の連続絞殺事件。警察の捜査もむなしく時効を迎え、迷宮入り事件となる。それから22年、派手なパフォーマンスとともに堂々と自分が犯人だと名乗り出た男が現れた。男の名前は曾根崎雅人。彼の書いた告白手記はベストセラーとなり、一躍時の人となった曾根崎の行動は日本中を翻弄する。

犯人だと告白した役を演じた藤原竜也と、22年前の連続絞殺事件に捜査員として関わった刑事役、伊藤英明の演技がいいんすよ。
世の中を大騒ぎにし翻弄されていく中での、この二人の底流から何故か感じる「凄みと覚悟」みたいなものがあるから、この話の展開が腑に落ちるわけですよ。
劇場型と言っていいこの犯人の告白劇場のピークである「ニュース番組での直接対決」は、キャスター役に中村トオル(今回は刑事役じゃないんだね!)とこちらも大物を配役して、とても見応えのある場面でした。(ここの中村トオルもよかったねえ)
視線や言動から「何かを狙ってる」のがわかる緊張感、一体どうなっちゃうのか、ドキドキですよ!

シナリオとしてはちょっと無理あるんじゃない?ミスリード誘うにしてもちょっとそれはないんじゃない?みたいな所が無きにしも非ずですが、役者さんの力で細かいところはねじ伏せちゃえるのはさすがです。

そんなには期待していなかったんですけど、期待以上でした。

個人的評価:★★★★☆

[MySQL]Twitter集計ではじめてMySQLを自分で設定した時のメモ

 

先日の立憲民主党フォロワー集計で、はじめてDBを自分で設定し使ってみた時の、備忘用リンク集とメモ書き。

■実行環境

  • サーバ :AWS EC2 t2.midium
  • OS : windows server 2012 R2
  • DB : MySQL5.7

1.Dataディレクトリを変更したらサービスが起動しない

「D:/MySQL」のディレクトリを作成後、隠しフォルダ以下の設定ファイル「C:\ProgramData\MySQL\MySQL Server 5.7\my.ini」を以下のように変更したところサービスが起動しなくなってしまった。

#datadir=C:/ProgramData/MySQL/MySQL Server 5.7/Data
datadir=D:/MySQL

こちらの情報にて解決。
Windows ServerにMySQLを入れてちょっとハマった事

MySQLの実行ユーザが「Network Service」なので、「D:/MySQL」ディレクトリにその実行ユーザをフルコントロールで追加した。

 

2.DBに入れた情報をcsvファイルに出力しようとしたら次のエラーになった

ERROR 1290 (HY000): The MySQL server is running with the –secure-file-priv option so it cannot execute this statement

こちらの情報にて解決。
[ MySQL ] データをCSVでエクスポートしようとして、secure-file-privに引っかかった件

最近のMySQLから「出力許可ディレクトリの設定がデフォルトで有効」になっているらしく、それ以外の場所を出力先に指定した為のエラーだった。
とりあえず「my.ini」のデフォルトの許可ディレクトリを空にしてサービス再起動し、どこにでも出力できるようにして対処。

# Secure File Priv.
#secure-file-priv=”C:/ProgramData/MySQL/MySQL Server 5.7/Uploads”
secure-file-priv=””

しかし出力先を「D:\users.csv」として出力しても何故か「D:\MySQL\users.csv」にファイルができる・・・何故だ。

 

3.テーブルの作成がめんどくさい

なんて言ったらDB本職の人から殴られそうですが。。。
最初にフィールド名とデータ型を定義してあげなきゃいけない。
取得するtwitterのユーザプロフィールには沢山の項目があって、それ全部のフィールド名とデータ型を定義するなんて面倒くさい。
しかも入れ子になってる項目はどうすればいいんだ、こっちはサーバとか多少触るけどDB素人やねんぞ!
と逆ギレしても仕方ないので、必要最低限のキーだけを入力する事とし、次のように定義して「users」テーブルを作成した。

CREATE TABLE users (
id_str bigint,
name text,
screen_name text,
protected char,
suspended char,
created_at datetime,
location text,
lang text,
statuses_count integer,
friends_count integer,
followers_count integer,
favourites_count integer,
last_tweet_time datetime
);

「last_tweet_time datetime」は最新のツイートの日時情報である「created_at」の情報。アカウント作成日時の方の「created_at」と被る為、別名にしている。

参考にしたのはこのページ
MySQLでテーブルを作成する方法【CREATE TABLE文】
MySQLのカラム型(有効範囲と必要記憶容量)

しかし項目が沢山ありどんな構造になってるのか把握するのも大変なtwitterの情報でいちいち定義なんてしてられない。次はjsonを定義無しにそのままぶち込めると言われるMongoDBを使ってみようと思った。MongoDBにもデメリットはあるようだが、自分1人が集計用に使うだけの後生大事にする必要もないデータであれば、問題ないだろう。

 

4.日時情報の変更

TwitterAPIに格納されてる日時情報はこんなフォーマットで使い勝手が悪い。

“created_at”: “Sat Oct 07 08:38:32 +0000 2017”

なのでMySQLのdatetimeに合わせて、こんな形に修正する必要がある。(日本時間なので+9時間もしておく)

“created_at”: “2017-10-07 17:38:32”

API取得とDB入力にはpythonを使ったが、時刻修正部分はdatetimeモジュールを使って以下のような処理にした。(dtに取得した値を入れて処理している)

dt_tmp = datetime.datetime.strptime(dt, “%a %b %d %H:%M:%S +0000 %Y”)
dt_tmp += datetime.timedelta(hours = 9)
dt = dt_tmp.strftime(‘%Y/%m/%d %H:%M:%S’)

■課題事項

  • インデックスについて何もしていない。いまのところそれほどパフォーマンスが落ちるような使い方でもデータ量でも無いようだが、そのうちきちんと調べておきたい。
  • データの性質と使用目的から考えると、定義する手間をかけるよりMongoDBでお手軽にjsonをそのままぶち込んだ方が良いかもしれない。次はMongoDBを使ってみる。(とは言え、項目も絞らずに全部入れるとDBサイズが大きくなるので、そのあたりの見極めもする)
  • 「D:\users.csv」にファイルを作成するつもりが、「D:\MySQL\users.csv」にできてしまう問題についてそのうち調べておく。

[時事ネタ]2017衆議院選挙

昼はあいにくの台風模様の中、投票を済ませ、夜はウィスキー片手に選挙特番にかじりつきでした。

子供の頃から好きなんだよねえ、選挙特番。

選挙なんて興味無い、何が面白いんだ、政治なんて誰がやっても同じ、って人結構いるけど、こんな面白いものそうそう無いと思うんだよね。

真面目な政策の話も大切だしもちろんそっちの方が興味あるんだけど、それ以外、ゴシップ的な話題だって政治界隈はたくさんニュースになってきたわけで、そういう人達の人生かけたリアルな泣き笑い眺めてるだけでも釘付けになっちゃうんだよね。

特にこの二人はゴシップ記事的にも注目されたんじゃないかと。

■不倫疑惑を記事にされた山尾志桜里議員は現在接戦

文春砲を喰らい民進党を離党。不倫の事実は徹底して否認しているけれど、それなら離党しなくてもいいような・・・。

無所属なので比例復活は無い、という事で勝たなければならないわけですけど、接戦できているという事はそれなりに彼女の活躍に期待している人も多いということですかね。

はてな匿名blogの「保育園落ちた日本しね」を国会に取り上げることで、待機児童問題を一躍国政の重要課題にぶち込んだ功績を皆忘れてないって事だね。

※その後僅かの差で山尾さんは当選しました

■このハゲーで一躍人気者の豊田真由子議員

全国の毛髪の残念な人を敵に回した豊田元議員。(いや、自分も将来的には危険なんだけど)

こちらも自民を離党し無所属となった上、同じ選挙区に自民の別候補を立てられた為に組織票も期待できず当選はほぼ絶望的だったわけですが、それでも心機一転孤軍奮闘、道行く小学生からの「ハゲー!」の声援を浴びながら泥臭い選挙活動やってたのが印象的でした。

まあ結果は予想通りでしたけど・・・人間の性格なんてそうそう変わらないから、改心したと信じてもらうのは大変だろうねえ。

ていうか、フジの選挙特番とか、開始直後くらいに「豊田真由子さん落選確実」とか速報入れてて笑ってしまった。開始直後なんて「当選確実」速報いくらでも入れられるだろうに、わざわざ落選確実速報入れちゃうあたり、フジのスタッフも意地が悪いw

 

全体としては与党が2/3とるのは各報道期間の事前予測通り。

しっかりとした野党としての仕事を期待した立憲民主党は、このままなら野党第一党になりそうで、投票した身としてはまあよかったんじゃないかなと思ってます。

希望の党はなあ・・・。

民進党を割った前原さんとか今後どうすんだろうね。

あの人、悪いおっちゃんじゃないと思うんだけど、あんな大博打的な事やれるようには見えないんだよね。いい意味でも悪い意味でも純粋なお坊ちゃんタイプと言うか(完全に偏見ですが)。

明日以降、希望の党はかなり揺れるだろうから、野党が最終的にどういう形になるか、まだ時間はかかりそうだ。

[時事ネタ]2017衆議院選挙の投票先

自分としてはもう決まっていまして。

後は投票当日、台風が来なければいいなと思うくらいなわけです。

元々自民くらいしか政権担当能力は無いわけで、自民が勝つ分にはまあいいんじゃないとしかいつも思ってないのですが、さりとて対抗勢力がしっかりしていないと政治は腐るのが世の常なので、だいたいの選挙では結局対抗勢力に入れてるんですよね。

で、今回も色々あって自民有利な展開で進んでますから、それなら対抗となる側に投票するいつものパターンです。

どこかと言えば立憲民主党です。

小選挙区も比例区もね。

政策には賛同するところもあれば、合わないところもあるんだけど、そんなのはどこの政党もそうだから。

それなら、ちゃんと政権側が腐らないように、しっかりと対抗勢力として、立憲民主党に期待したいね。

枝野さんには頑張って欲しい。

[時事ネタ]立憲民主党のフォロワーの件で追加ネタ

さて、立憲民主党のフォロワーについて、既に先日調査した通りの状況がみられた。

  • 15万くらいまでのフォロワーは至って健全にしか見えない
  • 10/9になって突然、ツイートゼロのスパム臭いフォロワーが激増した

ツイートゼロのアカウントが16万番目のフォロワーあたりから激増したグラフを再掲する。

さて、その後、フォロワー数が減ったり増えたりしながら推移していたので、ひょっとしてスパム臭いアカウントがフォロー解除したのではないかと思い追加調査した。

以下のグラフは、上記グラフ調査時点でフォローしていたアカウントの何番目にフォローしたアカウントが、フォロワーから消えているかを表したものだ。

横軸はどちらも、フォロー順を1000アカウント毎にブロックわけして集計したものなので、縦軸の最大アカウント数は1000になる。下図の400アカウントという数値は上図でいえば縦軸40%と同じインパクトになる。そして見ての通り、激増したツイートゼロアカウントの半分くらいが既に抜けている。

意図的にフォローを解除しているのか、相互フォロー状態にならないと時限式に解除されるのかは知らないが、いずれにしろ実態の伴わないアカウントが消えていくのは歓迎すべきことではないだろうか。

[時事ネタ]立憲民主党のフォロワー数激増の話で調べてみた

本気でそう思ってる人がどれだけいるのかわかりませんが、立憲民主党のフォロワー数が激増している事から「フォロワーを金で買ってるのでは」みたいな陰謀めいた言いがかりをつけてる人がいるらしい。

そのあたりに対する反論として、既にBuzzFeedNewsが十分な検証をしていた。

【検証】立憲民主党Twitter「フォロワーを購入」は本当か? 急成長で自民党を抜いたけれど…

偽アカウントや、活動していないアカウントの割合が立憲民主党だけ突出しているとは言えない。

立憲民主党だけを何らかのツールを使って調べ、「フォロワーを買っている」という記事は根拠がないと言える。

この記事中で紹介されている、twitterのアカウント診断ツール「Fake Follower Check」「twitteraudit」というのがなかなか凄いが、何十万ものフォロワーがいるものをどうやって調べているんだろう。

ちょっと調べてみるとtwitterにはユーザ情報など出力してくれるAPIが用意されているそうで、それをアレコレして判定してるんだな、きっと。
ちょっと興味が出てきたのと、3連休と時間もあるし、ここは一つ勉強がてらtwitterのフォロワー情報を知らべてみようとこの2日間頑張ってみたので、集計結果をメモしておく。
(あとでtoggeterにも纏めて、反応があるかみてみよう)

続きを読む

[アニメ]おそ松さん2期が今晩から順次放映

夜更かしはこたえるので録画予約だけしておくことにする。

1期はギャグアニメとしてなかなか面白かった。

そしてイケボ声優を使い、ギャグのノリも下ネタありの現代風お笑いコント番組に仕立て上げた事で、いわゆる腐女子界隈に大ウケしたお見事な構成だった。

あの勢いを2期でも保てるか?

正直楽しみである。

 

[おそ松さん 公式サイト]