先入観なくデータ活用をするためのシンプルな考え方

このエントリーをはてなブックマークに追加
2016年12月21日

009.jpg

誰かにメールしたり、商品を買ったり、どこかを訪れたり、人が行う行動はすべて関係性技術ではシンプルに「コンタクトをとる」という考え方で人や商品や場所とのつながりの強さを計測します。今回のコラムでは、関係性技術の考え方を、実際の人の行動に照らし合わせて解説します。

コンタクトの回数を計測するシンプルで新しい発想

関係性技術とは、簡単にいえば、それぞれのノード(語句)が、他のノードとコンタクト(関係)を持った頻度や時間を計測して、つながりの強さを算出するものです。

たとえば、30代男性のAさんのケータイ電話から、許可を得て行動履歴データを蓄積させてもらうとします。このとき、Aさんの行動に合わせて、次のようにログが記録されていくことになります。

  • Aさんが会社に到着(「Aさん」と「会社」との間でコンタクトを記録)
  • AさんがBさんに電話をかける(「Aさん」と「Bさん」との間でコンタクトを記録)
  • AさんがCさんからの電話を受ける(「Aさん」と「Cさん」の間でコンタクトを記録)
  • AさんがDさんにメールを送る(「Aさんと」と「Dさん」の間でコンタクトを記録)
  • Aさんが日経新聞のサイトを閲覧(「Aさん」と「日経新聞」の間でコンタクトを記録)
  • Aさんが「ビッグデータ」を検索(「Aさん」と「ビッグデータ」の間でコンタクトを記録)
  • Aさんがパズドラのアプリで遊ぶ(「Aさん」と「パズドラ」の間でコンタクトを記録)
  • Aさんがアマゾンを閲覧(「Aさん」と「アマゾン」の間でコンタクトを記録)
  • Aさんがアップルストアを閲覧(「Aさん」と「アップルストア」の間でコンタクトを記録)
  • AさんがiPhone6 を購入(「Aさん」と「iPhone6」の間でコンタクトを記録)
  • Aさんがローソンに行く(「Aさん」と「ローソン」の間でコンタクトを記録)

このように、Aさんがケータイを使って何らかのアクションを行うたびに、アクションの内容に関わりなく、コンタクトが蓄積されていきます。

関係性技術では、メールする、ある場所に行く、商品を買う、サイトを閲覧するなどの行動履歴を、すべて人や場所やモノのコンタクトとして計測します。そして観測されたコンタクトの数と頻度と時間の経過のみから、つながりの強さを算出して、関係性のデータとしてモデル化しています。

関係性技術はすべてのアクションを同じコンタクトとしてモデル化する
関係性技術はすべてのアクションを同じコンタクトとしてモデル化する


もし、より精緻なデータを求めるのであれば、人と場所とモノは、それぞれ別々のオブジェクトとして記録すべきでしょう。また、メールや電話や移動や購入も、それぞれ別々のアクションとして記録したほうがいいかもしれません。

しかし、それらを分類してしまうと、データの処理が煩雑になってしまいます。また、頻度の少ない行動(たとえばお財布ケータイを使っての購入など)は十分なデータが蓄積されません。

そうではなく、たとえばローソンへの訪問も、ローソンのサイトの閲覧も、ローソンへの電話も、すべてをローソンへのコンタクトとしてそれぞれ1回ずつ記録することで、Aさんとローソンとの間の「関係性」の強さを測定することができます。

このように、対象が人か場所かモノか、あるいはアクションが訪問か電話か購入かも区別せずに記録していくことで、先入観のない透明な評価が可能になります

Aさんの行動履歴が何カ月かたまったところで、実際にAさんと最も距離が近かったものを調べてみましょう。どのような結果が出るでしょうか。おそらく、Aさんが意識していないモノに、意外と関係性が深く記録されているかもしれません。

たとえば、Aさんは自分ではそれほど意識していないけれども「ヤフオク!」をいつもチェックしているかもしれません。あるいは、一番コンタクトが多いのが、部下のBさんかもしれません。ひまな時間があるたびに「将棋」アプリを起動していて、最も距離が近くなってしまう可能性もあります。

このような行動履歴データの面白さを手軽に体験してみたい場合は、ケータイの着信履歴やメールの受信履歴をのぞいてみましょう。1カ月もさかのぼれば、すでに忘れていた名前がたくさん見つかるはずです。

また、アンドロイドのスマートフォンを使っている場合は、グーグル・ナウという機能を利用することで、移動履歴も見ることができます。

関係性グラフは統合することで、より有用なデータベースになる

もし、Aさんが自らの行動履歴データを提供してくれれば、企業は、Aさんの趣味嗜好や消費傾向にぴったり合った、Aさんのためのマーケティングを展開できるはずです。

とはいえ、一般企業のマーケティングの対象はAさんだけではありません。たった一人の行動履歴だけを入手しても、新製品の企画やマーケティングには役立たないでしょう。

そこで、できるだけ大勢の人の行動履歴データが必要になります。

現在、性別や年齢を含む移動履歴のデータは、NTTドコモが個人を特定できないようなかたちにして「モバイル空間統計」という名前で販売しています。

ここでは、個人情報に配慮したうえで、大人数の行動履歴データが入手できたと仮定して話を進めます。

このとき、関係性技術では、Aさんを中心とした関係性データと、Bさんを中心とした関係性データ、また、Cさんを中心とした関係性データといった、それぞれの行動履歴データを、すべてスムーズに統合することができます

どのように行うかを簡単に説明しましょう。

まず、関係性技術においては、人や場所やモノといった語句を、ノードとして設定します。そして、たとえば「Aさんが日比谷公園に行った」というアクションがあったときに、それを「Aさん」というノードと、「日比谷公園」というノードとの1コンタクトとして記録します。コンタクトは、ノード同士のリンク(つながり)としてグラフ化(視覚化)されます。

関係性技術におけるノードとリンク
関係性技術におけるノードとリンク


このとき「Aさん」が毎日のように「日比谷公園」を訪問していて、コンタクトの回数が多くなれば「Aさん」と「日比谷公園」との距離が近くなります。距離が近くなると、グラフ上でも近く表示されます。

では、「Aさん」が「Bさん」と「新宿」の「SBカフェ」で会って、「カプチーノ」を注文したというイベントがあったとしたらどうなるでしょうか。

図のようになります。

A さんとB さんのカフェデートのイベントをグラフ化
関係性技術におけるノードとリンク


  • 「Aさん」は「Bさん」「新宿」「SBカフェ」「カプチーノ」とコンタクト
  • 「Bさん」は「Aさん」「新宿」「SBカフェ」とコンタクト
  • 「新宿」は「Aさん」「Bさん」「SBカフェ」とコンタクト
  • 「SBカフェ」は「Aさん」「Bさん」「新宿」とコンタクト
  • 「カプチーノ」は「Aさん」「SBカフェ」とコンタクト

このグラフではすべてのリンクを等しい長さで表していますが、もちろん「Aさん」と「Bさん」のコンタクトが他の場所でも頻繁に行われていれば「Aさん」と「Bさん」の距離は近くなります。また「Aさん」がいつもは「コーヒー」を頼むのに、たまたまこの日は「カプチーノ」を頼んだだけであれば「Aさん」と「カプチーノ」との距離は遠くなります。

「Aさん」や「Bさん」の過去数カ月にわたっての行動履歴が入手できていれば、ここで「Aさん」や「Bさん」を中心とした、関係性技術による詳細なグラフができあがるはずです(もちろん、グラフは関係性のデータを視覚化しただけのものであり、グラフ化以前に関係性のデータベースがつくられています)。

いかがしょうか?関係性技術では、起こった出来事がシンプルにモデル化されることがわかります。このシンプルな考え方は、どんなログでも扱うことができ、またログ同士を統合することも可能です。

次回は、この関係性グラフをマーケティングに活用するための使い方について解説します。

前回:ロイヤル顧客は利益をもたらさない?データが示したマーケティングの非常識

次回:個人の行動履歴を活用できるデータベースに変える方法

関連コラム:文章を関係性技術で扱えるデータに変換するための考え方と形態素解析術

関係性コラムトップ

トップへ戻る