Google Playには、アプリ名、開発元、カテゴリ、評価、レビューなど、アプリの反応を確認するための公開情報があります。
このページでは、PythonでGoogle Playの公開データを取得し、レビュー分析や可視化につなげるまでの流れを整理します。個別のコードを詳しく見る前に、「何が取得できるのか」「どの記事から読むとよいか」を確認する入口ページとして使えるようにまとめています。
このページで扱うこと
ここでは、主にPythonライブラリの google-play-scraper を使ったデータ取得を扱います。
- アプリIDの確認
- アプリ名、評価、レビュー数、カテゴリなどの取得
- Google Playレビューの取得
- 検索キーワードからアプリ一覧を取得する方法
- 取得したレビューを可視化・テキスト分析につなげる流れ
Google Playの内部データや、非公開の指標を取得するものではありません。取得できる範囲は、Google Play上で公開されている情報や、ライブラリ経由で参照できる情報に限られます。
はじめに読む順番
Google Playレビュー分析を始める場合は、次の順番で読むと進めやすいです。
- このページで、Google Playデータ取得の全体像を確認する
- Google Playレビュー可視化入門で、日次・月次の評価推移を見る
- Google Playレビューのテキスト分析入門で、レビュー本文の傾向を見る
- Google Playレビューの感情分析入門で、ポジティブ・ネガティブ傾向を補助的に確認する
- Google Playレビュー分析まとめで、実際のアプリ別分析を見る
このページは「データ取得」の入口です。アプリ別の評価傾向やレビュー内容を読みたい場合は、Google Playレビュー分析まとめの方が近いです。
利用上の注意
Google Playのレビューは公開情報ですが、取得したデータをどう扱うかには注意が必要です。
- レビュー本文を長文のまま転載しない
- ユーザー名、レビューIDなど投稿者の特定につながる情報を公開しない
- 短期間・少数レビューの結果を、アプリ全体の評価として強く断定しない
- ライブラリやGoogle Play側の仕様変更で、取得できる項目が変わる可能性を考慮する
- 取得したデータは、個人の検証や集計・分析の範囲で慎重に扱う
このサイトでは、レビュー本文をそのまま並べるのではなく、件数推移、評価別の傾向、テキスト分析の結果をもとに、全体の傾向を読み取る方針にしています。
google-play-scraperで取得できる主な情報
google-play-scraper を使うと、アプリ単位の基本情報やレビュー情報を取得できます。取得できる代表的な情報は次の通りです。
| 対象 | 主な情報 | 使い道 |
|---|---|---|
| アプリ情報 | タイトル、開発元、カテゴリ、評価、レビュー数、インストール数など | アプリ概要の整理、比較、分析対象の選定 |
| レビュー | 評価、本文、投稿日時、バージョン情報など | 評価推移、低評価理由、トピック分析 |
| 検索結果 | キーワードに一致するアプリ一覧 | ジャンル横断分析、会社別・カテゴリ別の候補収集 |
| 権限情報 | アプリが要求する権限 | アプリ仕様の補助情報として確認 |
ただし、すべての項目が常に取れるとは限りません。分析記事に使う場合は、取得日、対象アプリ、取得条件を残しておくと、あとから見直しやすくなります。
インストール
まずはライブラリをインストールします。
pip install google-play-scraper pandas取得したデータを表形式で扱うため、ここでは pandas も一緒に使います。
アプリIDを確認する
Google PlayのアプリページURLには、アプリIDが含まれています。
https://play.google.com/store/apps/details?id=com.example.appこの場合、アプリIDは com.example.app です。Google Playレビュー分析では、このアプリIDを基準にしてデータを取得します。
アプリ詳細を取得する
アプリの基本情報は、app() で取得できます。
from google_play_scraper import app
app_id = "com.example.app"
result = app(
app_id,
lang="ja",
country="jp",
)
print(result["title"])
print(result.get("score"))
print(result.get("ratings"))
print(result.get("genre"))lang と country を指定すると、日本語表示・日本向けストアの情報を取得しやすくなります。海外アプリや多言語レビューを扱う場合は、この条件も分析メモに残しておくと安心です。
レビューを取得する
レビューは reviews() で取得できます。まずは少ない件数から試すと、取得できる列やデータの形を確認しやすいです。
from google_play_scraper import Sort, reviews
import pandas as pd
app_id = "com.example.app"
review_rows, continuation_token = reviews(
app_id,
lang="ja",
country="jp",
sort=Sort.NEWEST,
count=100,
)
df = pd.DataFrame(review_rows)
print(df.head())
print(df.columns)最初から大量に取得するより、まず100件ほどで列名や日付、本文の入り方を確認する方が安全です。
レビュー取得で確認したい列
レビュー分析でよく使う列は、評価、本文、投稿日時、アプリバージョンなどです。
| 列 | 意味 | 分析での使い道 |
|---|---|---|
score | 星評価 | 高評価・低評価の分類 |
content | レビュー本文 | テキスト分析、要約、トピック確認 |
at | 投稿日時 | 日次・月次の推移分析 |
appVersion | レビュー時点のアプリバージョン | バージョン前後の評価変化 |
投稿者名やレビューIDのような情報は、公開記事の本文には出さない方針にしています。集計や重複確認に使う場合でも、外部に出す情報は最小限にします。
ページングしながらレビューを取得する
レビューを続けて取得する場合は、continuation_token を使います。大量取得の前に、件数、対象期間、保存形式を決めておくと扱いやすくなります。
from google_play_scraper import Sort, reviews
import pandas as pd
app_id = "com.example.app"
all_reviews = []
token = None
for _ in range(5):
rows, token = reviews(
app_id,
lang="ja",
country="jp",
sort=Sort.NEWEST,
count=200,
continuation_token=token,
)
all_reviews.extend(rows)
if token is None:
break
df = pd.DataFrame(all_reviews)
df.to_csv("google_play_reviews.csv", index=False, encoding="utf-8-sig")
print(len(df))CSV保存時に utf-8-sig を使うと、Excelで開いたときの文字化けを避けやすくなります。分析用に繰り返し使う場合は、CSVだけでなくParquetなどの形式も候補になります。
検索キーワードからアプリ一覧を取得する
特定ジャンルや会社別の傾向を見たい場合は、検索結果からアプリ候補を集めることもできます。
from google_play_scraper import search
import pandas as pd
results = search(
"RPG",
lang="ja",
country="jp",
n_hits=20,
)
df = pd.DataFrame(results)
print(df[["appId", "title", "score"]].head())検索結果は、Google Play上の表示やタイミングによって変わる可能性があります。会社別・ジャンル別に比較する場合は、検索キーワードや取得日を残しておくことが大切です。
取得したデータの活用例
Google Playから取得したレビューは、次のような分析に使えます。
- 日次・月次のレビュー件数推移を見る
- 星評価ごとにレビュー本文の傾向を比較する
- 低評価レビューで増えやすい話題を確認する
- アップデート前後で評価が変わったかを見る
- 複数アプリの評価傾向を比較する
ただし、レビューは投稿したユーザーの声に限られます。アプリ全体の利用者を完全に代表するものではないため、結果を読むときは「レビュー投稿者の範囲で見える傾向」として扱います。
次に読む記事
取得したレビューを分析に使う場合は、次の記事が続きになります。
- Google Playレビュー可視化入門|日次・月次の評価推移をPlotlyで分析する方法
- Google Playレビューのテキスト分析入門|ワードクラウド・共起ネットワーク・TF-IDFをPythonで可視化
- Google Playレビューの感情分析入門|ポジ・ネガ傾向をPythonで月次可視化する方法
- Google Playレビューのトピック抽出入門|LDAとBERTopicで話題を可視化する方法
- Google Playレビュー分析まとめ|アプリ別の評価傾向・トピック比較一覧
まとめ
Google Playの公開データを取得すると、アプリの評価推移やレビュー本文の傾向を、自分で確認できるようになります。
このページでは、アプリ情報、レビュー、検索結果を取得する基本的な流れを整理しました。実際の分析では、取得条件、対象期間、レビュー件数、データ上の限界を残しながら、グラフやテキスト分析につなげていくと見直しやすくなります。