サービスのデータとログはどう分析するのか — PM・マーケターのためのトラッキング入門

読了 5分

サービスを運営していると、「データをちょっと出してください」「今月のコンバージョン率はどうなっていますか」といった言葉が頻繁に飛び交います。PM やマーケターなら毎日のように出会う表現です。ところが、そのデータがどこから出てきて、ログや指標とどう違うのかは、意外とあいまいなまま通り過ぎてしまいがちです。

今回の記事では、サービスが残すデータとログがどう積み上がり、それがどう指標と分析につながるのかを、コードなしで解きほぐしていきます。

ログは、サービスが残す日記です #

サービスは動いているあいだ、絶えず記録を残します。誰がいつ接続したか、どんなリクエストが来たか、どこでエラーが出たかを、時間の順に書き留めておきます。これがログです。サービスが自分で書きつづる日記に近いものです。

ログは、問題が起きたときに真っ先にのぞき込む記録です。障害が起きたとき、何時何分にどんなエラーが出たかをログからたどって原因を探します。ふだんは目立ちませんが、何が実際に起きたのかを収めた、もっとも生のデータです。

イベントは、ユーザーが何をしたかを記録します #

ログがシステムの自動的に残す記録だとすれば、ユーザーの行動をわざわざ選んで記録したものがイベントです。ボタンを押した、登録を終えた、商品をカートに入れた、といった行動一つひとつをデータとして残すことです。

こうした記録はひとりでに積み上がりません。「このボタンを押したら記録を残せ」とあらかじめ仕込んでおいて初めて集まります。よく使われる Google アナリティクスのようなツールが、この仕事を助けます。だからマーケターが「このボタンにイベントを仕込んでほしい」と頼むときは、その行動をこれから数えられるように準備してほしい、という意味です。仕込んでいない行動は、あとからさかのぼって数えられない、という点が大切です。

指標は、データを要約した数字です #

ログやイベントが一つひとつの記録だとすれば、それを集めて一つの数字に縮めたものが指標です。一日に登録した人の数、訪問者のうち実際に購入した割合であるコンバージョン率、ひと月に一度でも立ち寄ったユーザーの数のように、散らばった記録を合わせて意味のある数字にしたものです。

指標が必要な理由ははっきりしています。数百万行の記録をそのままのぞくことはできないからです。身長と体重で健康をはかるように、いくつかの指標でサービスの状態をすばやく読むのです。コンバージョン率や再訪率といった指標が、マーケティングや企画で毎日のように口に上るのはこのためです。

分析は、問いから始まります #

指標をたくさん積み上げれば、すぐ分析になるわけではありません。分析はたいてい問いから出発します。「登録の手前まで行って、なぜ途中で離れるのか」といった問いがまずあり、その答えを探すためにデータをのぞき込むのです。

たとえば登録の過程を段階ごとに分けて、どの段階で人がもっとも多く抜けていくかを見ます。よく漏斗にたとえてファネルと呼びます。こうして見つけた段階を直し、もう一度指標を見て良くなったかを確かめる流れが分析です。ダッシュボードは、こうした指標を一目で見られるようにまとめた画面です。

数字を信じる前に、一度疑います #

データは強力ですが、いつも正しいわけではありません。イベントを間違って仕込むと、見当違いの数字が積み上がり、その上で下した判断もいっしょにずれていきます。だから数字がおかしいときは、結論を変える前に、このデータがきちんと集まっているかをまず確かめるほうが安全です。

見た目はもっともらしいのに、実際の成果につながらない数字もあります。たとえば訪問者の総数が大きく増えても、購入につながらなければ大きな意味はありません。こうした数字をよくバニティメトリクス(虚栄の指標)と呼びます。どの数字が本当に大切なのかを先に決めておくことが、分析の出発点です。

なぜ非開発者が知っておくと仕事が楽になるのか #

  • 依頼を正確にできます。 「データを出して」という漠然とした頼み方の代わりに、どのイベントが仕込まれていればその数字を出せるのかを知って頼めば、開発者との会話が速くなります。
  • 指標を正しく読めます。 コンバージョン率や再訪率が何を合わせた数字かを知っていれば、数字一つに振り回されず、文脈も一緒に見られます。
  • 前もって準備できます。 いま仕込んでいない行動はあとから数えられない、という点を知っていれば、機能を作るときに計測も一緒に用意できます。

まとめ #

今日は、サービスが残すログとイベントがどう指標に要約され、問いから始まる分析につながるのかを見てきました。ログはシステムが残す日記、イベントは選んで記録したユーザーの行動、指標はそれを要約した数字、という区別が大きな絵です。

ログが障害対応でどう使われるのか気になればバグ、ホットフィックス、ロールバックを、指標で仮説を検証しながら小さく出していくやり方が気になればアジャイル、スプリント、MVPを一緒に読んでみることをおすすめします。

X