Webサイトのログをとりあえず入れてみました

このエントリーをはてなブックマークに追加
2016年07月12日

アクセス解析ツールなどの普及により、Webサイトに訪れるユーザーの詳細なログがとれるようになりました。最近ではツールの発展により、ユーザーひとりひとりの行動履歴さえ追えるようになってきています。

しかし、Webサイト解析では数値から統計的なアプローチで解析していくのが今は主流で、個々のアクセスの遷移などはなかなか活用に結び付けられていないのが現状です。

何を分析すればよいかわからないという悩み

新聞記事を見ていると、データ活用で企業に多い悩みのひとつが「何を分析すればよいかわからない」というものです。技術の進化によって膨大なデータが集約されていますが、そこから価値を生み出すには、仮説や活用イメージの設定が必要です。

今回も、ログデータを前に、何を分析しようか、どんな仮説を実証しようか悩みました。分析の目的を決めるにはひらめきが必要で、これが分析自体よりも何よりも難関なのです。

関係性技術は、データを入力するだけで関係性をモデリングできるという特徴があります。この特徴を活かしてまずは何も仮説を立てずに、データを入れてみることにしました。

入力したデータ

Yahoo!アクセス解析のログ(2014年11月~2015年3月)

デバイス種別 アクセス日時 ユーザーID(※1
顧客ID(※2 Facebook ID Twitter ID
IPアドレス UR ページ名
検索キーワード 参照元URL ~ページ目のアクセス(※3
OS OSのバージョン ブラウザー
ブラウザーのバージョン 機種名  

※1 ユーザーID
解析対象サイトに訪問したユーザーに付与されるID。ユーザーIDはCookie情報ごとに付与されるため、解析対象サイトへの訪問者が同一端末で当該サイトにアクセスしても閲覧ブラウザーが異なる場合は別ユーザーとして解析される。

※2 顧客ID
login idなどで顧客が識別できた場合に、自分でセットすることができるもの。通常は空

※3  ~ページ目のアクセス
訪問してから何ページ目の閲覧か

(入力データの構成、詳細はページ下部に記載)

個人の行動の関係性を見る

まず、ユーザーIDを基点に抽出して結果を比べてみました。任意に抽出したユーザ4名を距離で比較してみましょう。

ユーザ1

ユーザ1を基点にした結果

一番近い距離にあるコンテンツは、「オープンツール」でした。そのほかに、上位に来ているものは、 「モバイルソーシャライズシステム(MSS)とは?」や「資料ダウンロード」など、関係性技術の技術内容に関連するコンテンツが多めの印象です。

関係性技術の技術的要素に興味があることが予想されます。技術に関する追加情報を提供するなどするとより関心を引くことができるかもしれません。

ユーザ2

ユーザ1を基点にした結果

「入会のご案内」や「参加団体」「モバイルソーシャライズシステムフォーラム(MSSF)について」や会員の紹介ページ、「活動概要」など、フォーラムに関するコンテンツが近くに来ています。フォーラム自体に関する興味が高いのかもしれません。

ここに掲載している以下に続くコンテンツでは、トピックスのページが続いていました。中でも、入会や活動に関するトピックスが多めです。 入会を具体的に考えている可能性があるので、入会に関する内容や規約などを追加情報として提供すると効果的かもしれません。

ユーザ3

ユーザ1を基点にした結果

「モバイルソーシャライズシステムフォーラム(MSSF)について」や会員の紹介ページ、「委員会について」や「活動概要」など、ユーザ2同様にフォーラムに関するコンテンツが近くに来ています。 ユーザ2との違いは、掲載している以下に続くコンテンツに関係性コラムのページが目立っていたことです。
コラムのような読み物から具体的な活用方法にも興味があるようなので、他の会員の活動やケーススタディを紹介するとよさそうです。

ユーザ4

 

ユーザ1を基点にした結果

「トピックス」のコンテンツが上位に連なっています。 これまでフォーラムがどんな活動をしてきたのか?どんな成果を輩出してきたのか?に興味がありそうですね。 これまでのフォーラム活動や実用化の成果などを中心に紹介すると興味を強めてくれそうな印象です。


以上のように、各ユーザごとに関係性の違いが顕著に現れました。個人の行動履歴をみても何がポイントなのかは判断しづらいところですが、関係性技術ではユーザの過去の行動や他のユーザ、コンテンツとの関係の経路やつながりの強さも加味しながら、関心の度合いを数値化できます。 抽出してみるだけで、ユーザの傾向を見ることができるのは関係性技術のおもしろいところです。

コンバージョンコンテンツの関係性を見る

次は、サイトの目的であるコンバージョンのコンテンツから関係性を見てみましょう。

このサイトのコンバージョンは、「お問い合わせ」「入会説明予約」のフォーム送信完了と、「資料ダウンロード」です。コンバージョンしたかどうかまでは残念ながらこのデータでは取得できていませんが、コンバージョンする直前のページを基点にして、距離のランキングを見てみました。

黄色のノードは他のコンバージョン直前のコンテンツを表しています。「お問い合わせ」からは他のコンバージョンもすべて近いことが分かります。

また、橙色のノードに注目してみると、「お問い合わせ」「入会説明予約」を基点にした結果では、上位にワークショップに関するコンテンツが特徴的に表れています。「問い合わせ」や「入会説明予約」のきっかけとして、ワークショップの開催やその内容が関連している可能性があります。ワークショップは、サイトのコンバージョンに誘導する魅力ある活動なのかもしれません。

また、「資料ダウンロード」では各会員の紹介ページの影響は大きいようです。各会員の取り組みから興味を深め、資料を求めている可能性があります。

ワークショップのコンテンツから「問い合わせ」や「入会説明予約」に誘導したり、「資料ダウンロード」のあとに会員の取り組みページへ誘導するなどの施策でコンバージョンを促すなども考えられそうです。

水色のノードは、個人を表しています。コンバージョンに近いがまだコンバージョンしていないとなれば、こちらから連絡してみるなどの価値はありそうです。この個人を基点とした結果と合わせれば、それぞれのコンバージョンへの最適な誘導方法が見えてくるかもしれません。

とりあえずデータを入れてみたまとめ

今回は、とりあえずあるデータをあまり加工せずに入れてみて、結果から考察してみました。基点ノードからランキングをみるだけで、これだけ多様な仮説を作るのは、統計的アプローチなどでは難しいことではないでしょうか。

精度がでるのか、正しいかどうかは、もちろん検証の必要があります。しかし、関係性の「距離」という根拠をもって仮説を導き出すことができることは確かです。

数値を見ながら有意かどうかを分析するアプローチは、もちろん非常に有効です。しかし、現状ではその前の段階の「何を分析するのか?」という問題が現状のデータ活用にはつきまとっています。

まずはデータをそのまま入れてみてください。大きなチャンスの可能性を広げることができるはずです。

 

入力データサンプル

2016-07-12_002053.png

入力データは、1セッションを1イベントとして生成しました。

1イベントのイメージ

2016-07-12_002403.png

データ構成

 アクセス日時,ユーザーID, IPアドレス, URL,訪問したページ1,訪問したページ2…,流入経路

イベントファイル例

2014/12 /17,ユーザーC,IP3,《公式》モバイルソーシャライズシステムフォーラム(MSSF),代表発起人プロフィール,モバイルソーシャライズシステム (MSS)とは?,モバイルソーシャライズシステムフォーラム(MSSF)について,参加団体, https://www.facebook.com/mobilesocialize/
2015/01/30,ユーザーD,IP4,エースチャイルド株式会社,参加団体
2014/11/30,ユーザーE, IP5,《公式》モバイルソーシャライズシステムフォーラム(MSSF),
2015/01/30,ユーザーF, IP6,《公式》モバイルソーシャライズシステムフォーラム(MSSF), トピックス, MSSが目指す社会,資料ダウンロード


関係性コラムトップ

トップへ戻る