APIを用いたデータ活用 データサイエンス

TwitterAPIで遊んでみた

広告

目的

最近Twitterを使い始めたのでAPIを使ってどんなデータを取得できるのか知りたい。

可能ならば成功しているプロジェクト、失敗しているプロジェクトのツイート推移などに何か傾向があるのかを見つけたい。

使用API

TwitterのAPIは複数存在していますが、今回使用するのは「Search Tweets」を使用しています。

作成したダッシュボード

PythonでAPIを使用してcsvで出力。そのファイルをPowerBIで可視化したアナログ仕様です

所感

可視化したものの思っていたよりも有用な情報が得にくいです。

特に1週間分のデータまでしか取得できないのが致命的なので元々知りたかった

可能ならば成功しているプロジェクト、失敗しているプロジェクトのツイート推移などに何か傾向があるのかを見つけたい。

という目的を実現することはできませんでした。

有用そうであれば日次自動化処理を組んでみたりしたかったのですが、ひとまず保留です。

出来そうなこと

  • 特定のワードを含んだツイートを抽出
  • ツイート人数の推移の確認
  • ユーザーの質はフォロワー数でセグメントすることは可能
  • 複数のワードで比較を行い、プロジェクトごとにフォロワー数セグメントの内訳を比較することは可能
  • 精度はいまいちだが、言語別でのフィルターもかけることは可能
  • 元のツイート内容もわかるので特定のワードをツイートしているフォロワー数多い人なども調べられる

出来なそうなこと

  • 1回のデータ取得には直近1週間、もしくは約18,000件のデータ取得制限があるため過去推移の確認ができない
  • よく使われるようなワードだと他のものを指しているツイートも拾ってしまう
  • ハッシュタグを外すとデータ取得上限に引っかかったり他の意味で使われているツイートを拾う数が増えるので現実的でない
  • 緯度経度などの地域データは取得できなそうだったので、海外ユーザーの細かい動向は追えなそう

-APIを用いたデータ活用, データサイエンス