GoogleアナリティクスのデータをR言語で解析しよう【下準備編】

GoogleアナリティクスのデータをR言語で解析しよう【下準備編】

ともぞう

ともぞう

こんにちは! ディレクターのともぞうです!

最近Macのカーソル移動がEmacsのキーバインドに対応していることを知り、たまに頑張っています!
どっちかというとVim派です。

さあ! ディレクター連載「統計入門のはじめ」の第9回です!

今回はより実践的なものを使用していきます。
Googleアナリティクスのデータを使って解析してみようという魂胆です。

本記事では、解析にあたっての下準備の回です。

前提として

Googleアナリティクスのデータを用いるので、何かしらのサイトのアナリティクスを閲覧できることが最低条件になります。
Googleアナリティクスのデータを使用するにあたって、以下を用意してください。

  • Googleのアカウント
  • Googleアナリティクスへのアクセス権限

手順

まず、スプレッドシートにGoogleアナリティクスの数値を出力する手順を説明します。

  1. スプレッドシートのアドオンを入手する
  2. アドオンでスプレッドシートにGoogleアナリティクスの値を出力する
  3. 2で得た結果をCSVなどに変換する
  4. 3のファイルをR言語で加工する

大きく分けて、4つのステップで完了です。

1. スプレッドシートのアドオンを入手する

Googleアナリティクスが公式で出しているスプレッドシートのアドオンがありますので、入手します。
手順は下記です。

アドオンを取得

01

Google Analyticsでアドオンを検索する

02

追加をしたら許可する

03

許可が完了したらアドオンの中にGoogle Analyticsが追加されている

04

これでGoogelアナリティクスの値をスプレッドシートに書き出すことができるようになりました。

2. アドオンでスプレッドシートにGoogleアナリティクスの値を出力する

アドオンを入手したらいよいよデータの取得です。
取得したいデータを指定して

RUN

するだけです。
ただ、微妙に癖があるので使い方を説明します。

Create a New Reportする

アドオンメニュー内にあるCreate a New Reportを押下すると下図のようなものが表示されます。

06

それぞれの項目を説明していきます。

Name Your Report

任意のレポート名を指定します。
用途に合わせたカッコいいレポート名をつけてください。

Select Account Information

Account
ログインしているアカウントに対して、許可されているGoogleアナリティクスのアカウントを選択します。

Property
アカウントの中のプロパティを選択します。

View
Viewを作成している場合、選択します。

Choose Metrics and Dimensions

取得したい値を指定します。
例えばPageViewなどはここで指定します。
複数選択可能です。

取得するデータを指定する

ここで説明するものはあくまでも一部です。
基本的にはGoogleアナリティクスのAPIと同じようなのでより詳しく知りたい人はリファレンスを参照してください。
Metrics
Metricsではユーザーやセッションといった取得したい数値を指定します。

ga:users ユーザーを取得します
ga:sessions セッションを取得します
ga:organicSearches オーガニック検索での流入数を取得します
ga:pageviews ページビューを取得します
ga:bounces 直帰数を取得します
ga:bounceRate 直帰率を取得します
ga:avgSessionDuration セッション時間の平均秒数を取得します

Dimensions
セグメントして取得したい際に指定します。

ga:pagePathLevel1 URLの第1階層目のPathを取得したいときに入れます
ga:pageTitle ページのタイトルを取得したいときに入れます

Filters
Googleアナリティクスのフィルタと同様、取得したいページの指定などができます。

ga:pagePath== 取得したいページのURLを指定します

3. 2で得た結果をCSVなどに変換する

ここでの作業はR言語で読み込めるようにCSV形式に書き出すだけです。
もともとスプレッドシートにある書き出し機能を利用します。

08

大公開! ディレクター連載のデータを公開…!
サンプルデータとしてLIGブログのデータをCSVとして下記にアップしています。
対象は過去にディレクター陣が連載していたいいWebつくろう〜クライアントと制作会社〜の9月のデータです。

サンプルCSVをダウンロードする際には以下の利用規約をご確認いただき、同意の上でご利用ください。

利用規約
  • このサンプルはあくまで実際のデータを利用しての参考にすることを目的として配布するものです。
  • デザイン及びアイキャッチ、バナー、ロゴに使用されている素材の著作権はLIGに帰属し、一切の二次使用を禁止します。
  • CSVファイルの再配布・販売を禁止します。
  • CSVファイルの著作者を偽って公開する行為を禁止します。
  • 個人の使用範囲内においてのみ、オリジナルファイルの改変を行うことが可能です。
  • 改変されたCSVファイルを公開する行為を禁止します。
  • 改変されたCSVファイルは知人や社内など、限定された範囲内で共有することが可能です。ただし制限を設けていても、不特定の人間がアクセスできる場所にCSVファイルを置くことは禁止します。


規約に同意してCSVをダウンロードする

4. 3のファイルをR言語で加工する

CSVファイルをR言語のプロジェクト内に格納し、読み込みます。
試しにページビューの値を見てみましょう。

ga_csv <- read.csv("./sample.csv")
ga_csv$ga.pageViews

R言語で加工してみる

中央値

mean(ga_csv$ga.pageViews)

色々な代表値

summary(ga_csv$ga.pageViews)

まとめ

やっとWebディレクターとしてR言語(統計学)を実務に活かせる環境になりました…!
このアドオンのいいところは、URLを指定することで数値を取りたいページのみ選択できることかなと思っています。
例えば、最近LIGブログは連載形式をとっていますが、連載ごとにディレクトリが分かれているわけではないので、指定した連載のみの数値をとるのが若干面倒でした。
(カスタマイズすることでできると思いますが)

今回は、統計感があまりなかったですが、次回にJack氏がよりいい感じに加工してくれるはずです…!

それでは、また!

この記事のシェア数

ディレクターのともぞうです。 趣味はサバゲー、ツーリングです!! 月一くらいで出撃しています┌◯

このメンバーの記事をもっと読む
数字を見極める統計入門 | 10 articles
デザイン力×グローバルな開発体制でDXをトータル支援
お問い合わせ 会社概要DL