Google Analytics の数値、実数じゃないの?

実数でもあり、実数でもないこともあります。多くの場合は実数です。とはいえこの実数というのも Google Analytics が記録している実数というわけなのですが。

公式のヘルプを要約すると、基本として以下の様な事が書かれています。

「プロパティ単位で、レポートの収集対象(=選択した期間内)が 50万セッション、Google アナリティクス360 の場合は 1億セッションを超えると自動的にサンプリングが実行されます。」

 

スタッフ『え?試しにサイト立ち上げてすぐ、社内 5人でアクセスしてテストしてみたけど、セッション数 5 にならなかったよ!』

という方は、以下の様なことが考えられるそうです。

Google Analytics 公式ヘルプ曰く「実装が複雑」、具体的には、クリックなどのイベントに計測トリガを入れていたり、カスタム URL キャンペーンがあったり、ビューに何かしらのフィルタを用いていたりすると起こる模様です。
もう一つ、Google Analyticsでは、アクセスを一気にレポートに反映するわけでは無く段階的に計算し、最大72時間のデータ処理後にレポートへ反映が行われるそうなので、暫定値を見ている可能性もあります。

 

スタッフ『じゃあ、直近じゃ無くて、昔のデータを集計したけど、レポート上部に “このレポートは N 個のセッションに基づいて生成されています。” とか出たよ。これサンプリングされてる?なんで?』

これも確かに見かける状態ですね。
これは、1年を超えて集計期間を設定したり、2016年9月より前のデータが含まれている場合に、サンプリングがかかるとのことで、サンプリングされている場合に表示されるメッセージです。

 

スタッフ『へー。でも、先月のスマホの新規ユーザーでコンバージョンした方のページ別訪問件数を調べようとしたら、サンプリングされたんだけど?』

セグメントやフィルタ、セカンダリ ディメンションを適用していったり、カスタム レポートを作成した場合、それが複雑であると、全データをひっくり返してから計算するため、その全データが最初のセッション数制限を超えているとサンプリングされることになるとありますね。

 

サンプリングされている場合は、上述の通りレポート画面に “このレポートは N 個のセッションに基づいて生成されています。” と表示されますので、表示されていなければ実数とお考えください。

と申しますか、本当に正確な実数を知りたい場合は、サーバ上のログに頼るなり、届いたメールの数を記録するといった事で対応しましょう。
アクセス統計ツールは、正確な数値を得るという視点から、許容できる正確性に基づいた傾向値を見るという視点までの広さを持って扱うのが良いでしょう。