サイト概要

当サイト「データサイエンティストの遊び場」は、YouTube・Google Play・Steamなどの公開データをPythonで取得・加工し、可視化やテキスト分析を通じて、データから見える特徴や傾向をわかりやすく整理する個人ブログです。

単なるツール紹介やレビューではなく、実際にデータを取得し、前処理・集計・可視化・自然言語処理を行いながら、「データを見ることで何がわかるのか」を実例ベースで紹介することを目的としています。

このサイトで扱う主なテーマ

  • YouTubeデータ取得・分析
    YouTube Data APIや関連ライブラリを使い、動画一覧、字幕、チャット、文字起こしデータなどを取得・分析する方法を紹介します。将来的には、VTuberチャンネルや配信データの特徴を可視化する分析にも取り組んでいきます。
  • Google Playレビュー分析
    Google Playに投稿されたアプリレビューを取得し、星評価の推移、レビュー本文のテキスト分析、トピック抽出などを通じて、ユーザーが魅力に感じている点や不満を持ちやすい点を整理します。
  • Steamデータ取得・レビュー分析
    Steamのストア情報、レビュー、同時接続数などの公開データを取得し、ゲームごとの評価傾向やレビュー本文から見えるユーザー評価の特徴を分析します。
  • データ分析・可視化の実践メモ
    APIキー管理、データ取得、前処理、可視化、テキスト分析など、Pythonを使ったデータ活用の手順を実例付きで整理します。

サイトの目的と方針

データ分析は、専門的な業務だけでなく、ゲーム、動画、レビュー、配信など身近なコンテンツを理解するためにも活用できます。当サイトでは、公開されているデータをもとに、取得方法から分析結果の読み取り方までをできるだけ具体的にまとめています。

技術記事では、読者が実際に手元で試せるように、実行環境、サンプルコード、出力例、つまずきやすいポイントをできるだけ明記します。レビュー分析記事では、単なる感想ではなく、レビュー本文や評価推移などのデータから見える傾向を整理することを重視しています。

対象読者

主な対象読者は、PythonやAPIを使ってデータを取得・分析してみたい方、レビューや動画データを可視化して傾向を読み取りたい方です。また、ゲームや動画配信などのコンテンツを、データの視点から見てみたい方にも楽しんでいただける内容を目指しています。

データ利用について

当サイトで扱うデータは、各サービスで公開されている情報、または公式API・一般に利用可能なライブラリを通じて取得できる情報を対象としています。記事内の分析結果は、取得時点の公開データに基づくものであり、対象サービスや作品全体の評価を断定するものではありません。

また、APIや外部サービスを利用する際は、各サービスの利用規約、著作権、アクセス制限に配慮し、過度なアクセスや第三者コンテンツの不適切な利用を避ける方針です。

今後の展望

  • YouTube・Google Play・Steamなどの公開データを使った分析記事の拡充
  • APIやライブラリを使ったデータ取得手順の整理
  • レビュー本文や字幕データを使ったテキスト分析・可視化の実践
  • ゲームや配信コンテンツをデータの視点から楽しむ記事の作成

今後も、データ取得から分析結果の読み取りまでを一つずつ整理しながら、データ分析の楽しさや応用の幅が伝わる記事を追加していく予定です。

2022年10月25日