APIを用いたデータ活用 データサイエンス

GooglePlayAPIで遊んでみた

広告

目的

データ分析を行うにあたり、様々な仮説を出すためにはドメイン知識は重要となる。

しかし、全員が全員分析対象となる分野に興味があるわけではない。

以前ソーシャルゲームの分析を行っていた際にレビューデータを使って仮説出しの参考にならないか?という目的でAPIを触ってみました。

今回は原神で試していますが、他のアプリでも同様に作成が可能です。

使用API

今回は google_play_scraper を使用してレビューデータを取得しています。

作成したダッシュボード

レビュー数の推移や平均スコアの推移、スコアやいいね数で条件を絞ったレビュー内容を確認することができます。

ワードクラウド

頻出単語ほど大きく表示されるワードクラウドというものがあるのですが、ぱっと見すごそうと思えるものの解釈性は悪すぎて実案件では使いにくい印象です。

下記のものは全期間のデータで作成したものですが、国内版のレビュー内容のみを使用しているのですが英単語が多くよくわからないですね。

それではレビュー点数1に限定した場合はどうなるでしょうか。

処理が重いことが主に書かれていてガチャについて書いている人もいますね。これならさっきのものよりはまだ使えそうです。

共起ネットワーク

ワードクラウドは単語ごとの出現頻度に応じて可視化されたものですが、今度は共起ネットワークを試してみます。

共起ネットワークはどの単語同士が一緒に使われやすいかを可視化してくれるものです。

ワードクラウドと同様にスコア1で作成した結果がこちらです。

キャラやガチャを繋ぐ線が太いのでこれらの単語を一緒に使う人が多いという解釈になります。

レビュースコア1の人は★5キャラの獲得に関する不満やスマホ版の操作性に関する不満がありそうですね。

今度は反対にレビュースコア5の人で作成してみようと思います。

キャラ育成やキャラストーリー、グラフィックの綺麗さに魅力を感じている人がいるようですね。

htmlファイル

本当は共起ネットワークで作ったファイルはhtmlファイルでドラッグでグリグリできるのですが、いい感じに貼れなかったのでサンプルデータを置いておきます。
特に悪いものは仕込んでいません。

所感

アプリのダウンロード数によってレビュー数が異なりますが、一定のレビュー数があるアプリならば一定の知見が得られそうな気がします。

ソシャゲでしか確認はしていませんが、仕組み上はGooglePlayのアプリすべてに使えると思うのでアプリの分析をする際にはとりあえず見てみるという使い方ができそうです。

実案件で使うならば直近のバージョンに限定してみて不満点や魅力に感じているところを確認してそこから仮説出しをする感じかなと。

iOS版も同様のデータが取得できそうか今後確認をしてみたいと思います。

今後の課題
  • 共起ネットワークに関しては色分けだったり条件設定が色々できそうなのでまだいろいろできるかも
  • 特定の絵文字だか何かが入ると共起ネットワークがエラー出してしまうのでそこの修正も必要
  • アプリレビュー全件取得の関数が使うたびに取得件数が異なることが過去にあったため、実際に使うときは要確認

-APIを用いたデータ活用, データサイエンス