羽生善治さんの記者会見をテキストマイニング

この記事は約2分で読めます。

年始から人工知能開発にも使われるプログラム言語「Python」を勉強中。
スマホで言うところのアプリにあたるライブラリと呼ばれるものが豊富で、
機能を拡張できるのがPythonの特徴らしいのだけど、
これらのインストールでかなり苦戦して、グッタリしている。

これまでにつまづいたことを記録しておくと、

  • 統計分析「StatsModels」…Visual C++ 2015 Build Toolsをインストールが必要。
  • 図形描画「Matplotlib」…文字情報の日本語化ができない。プログラムの冒頭にフォントの宣言することで代用。
  • 言語処理「NLTK」…最新版のpython3.6に非対応でインストールできない。
  • 形態素解析「MeCab」…Windows環境にインストールが困難で数日格闘するも断念。同様のソフト「janome」で代用。

気分転換にひとつ遊び。

永世七冠達成後の羽生善治さんの3つの会見で、
羽生さんの言葉の中で頻出した名詞を可視化してみた。

  • 2017年12月5日の竜王戦勝利後の会見
  • 2017年12月13日の日本記者クラブでの会見
  • 2018年1月5日の国民栄誉賞の授与決定後の会見

文字が大きいほど使った回数が多い言葉。
解析してみて羽生さんが「非常に~」という表現を多用することが分かった。

使用したライブラリ

  • janome
  • Word Croud

コメント