データを活用するためにデータを捨てるという現実

このエントリーをはてなブックマークに追加
2016年09月14日

データの集約技術が発達した現代、使い道の定まらないデータが手元に自動的にどんどん集まっています。
膨大なデータを前に、どのように使うかを決めることさえままならないことも多いのが現状ではないでしょうか。

今回は、大量に蓄積したデータの活用現場で、データを活用しきれずに大量に捨ててしまっている現実についてです。

価値あるデータをみすみす捨ててしまっている

データ分析によるマーケティングは、一見、素晴らしい分析結果をもたらしました。
最もよく知られているのは「紙おむつとビール」の話です。

POSシステムがアメリカに広く普及した1992年頃の話です。
オスコ・ドラッグという小売ストア・チェーンが、自社で集めたPOSシステム・データの分析を、POSシステムの販売元であるNCRという情報処理会社に依頼しました。
この情報処理会社は、コンピュータを駆使して、バスケット分析を行いました。

バスケット分析とは、買い物の履歴から、一緒に買われる商品の組み合わせを分析するものです。さまざまな商品の販売数量を比較した結果、情報処理会社は数多くの相関関係を見つけ出して、クライアントに報告しました。

情報処理会社の担当者が最も興味深いと感じたのは、次のような分析結果でした。

「アメリカ中西部の都市のある店は、ある人が午後5時に紙おむつを買ったとすると、次にビールを半ダース買う可能性が一番大きい」

この分析結果が、世間に大きく知れ渡ったのは、世界的に有名な経済新聞「ウォール・ストリート・ジャーナル」が「スーパー・コンピュータが歳末商戦の在庫を管理する」とい記事に仕立てて大きく報道したからです。

「午後5時から7時にかけて、紙おむつとビールの6本パックが一緒に買われる」という「発見」は新聞の読者をも、たいへん興奮させました。

そして話はメディアや講演などで広められ、今ではデータ分析の定番話として知られるようになっています。

話が広がるたびに、この分析結果に対して、さまざまな推測が付け加えられました。
最もよく知られているのは次のようなものです。

「家で赤ちゃんが泣いている。お母さんは忙しくて買い物に行けない。そこでお父さんに、仕事帰りに紙おむつを買ってきてくれと頼む。
やれやれとお店に寄ったお父さんは、自分へのご褒美にビールの6本パックを手に取り、紙おむつとともに買い物かごに入れるのだ」

よくできたストーリーです。こんな話もあります。

「分析結果を受けて、そのお店はさっそく紙おむつの隣にビールを並べることにした。するとどうだろう。紙おむつを買ったお客さんは、やはりビールを買いたい気持ちが潜在的にあったと見えて、ビールの売り上げがものの見事にはね上がったのだ」

これぞ、マーケティングの好例といいたいところですが、実際には、この分析結果を受け取ったオスコ・ドラッグの担当者は「この相関関係は偶然だろう」と言って、マーケティングへの活用を考えなかったそうです。

データ分析によって、マーケティングに利用できるかもしれない結果が出たとしても、マーケッターが利用しなければ何の意味もありません。

そして、データ分析によって出てくる結果は、実は使えないものが多く存在しています

情報処理会社は、「ジュースと咳止め薬」とか「キャンディとグリーティングカード」などの組み合わせについても仮説を立て、検証を行ったそうです。しかし、それらはそれほど強い相関関係を持ちませんでした。

また「紙おむつとビール」以外にも、強い相関関係を持つ組み合わせはいくらでもあります。
たとえば「ワインとチーズ」「コーンフレークと牛乳」「歯ブラシと歯磨き粉」「スプーンとフォーク」などです。
しかし、これらはわざわざデータ分析によって教えてもらわなければならないようなものではありません。マーケッターがすでに知っているようなことを示唆されても、新しいマーケティングには結び付かないのです。

大量にデータが集まる環境ができているにもかかわらず、その集まったデータを使いきれていないというのは非常にもったいない話です。

データ活用の現場では、集められたデータのほとんどを、やむなく捨ててしまっていることがよくあります。100のデータが手元にあったとしても、その中から自社のビジネスに有用と思われるデータを選別したり、分析ツールにかけるためにクレンジングを行ったりする過程で、100が80にも、50にも絞り込まれていくからです。

利用されずに削られていくこれらのデータにも、人の行動やモノの流通が多種多様な形で埋め込まれているはずです。
しかし、現状では蓄積はされているが利用されていないデータが大量に存在しています。

一般的に、データ活用においては、どんな結果を導くために、どんなデータを使って、どのように分析するかという仮説が必要とされています。
そこには人間の考えやアイデア、あるいは思い込みが入り込み、まったく考えもしなかった気づきが純粋にデータによって与えられることは稀です。しかし人間の記憶や思考からは出てこない結果を、客観的な事実に基づいて示してくれる可能性があるところにデータの価値は眠っています

「ゴミ」だと思われていたデータから、思いがけないビジネスのヒントが生まれる可能性があることを、「仮説を立てる」「データクレンジングをする」「分析ツールにかけるために加工する」といった常識のもとに見過ごしてしまってはいないでしょうか。

次回からは、余すことなくデータを利用する関係性技術の特徴や使い方をご紹介します。

前回:IoTシステム搭載の公共ゴミ箱によるデータ収集事例

次回:データを関係性の1点で整理・分析する

更新はfacebookでお知らせしています。

関係性コラムトップ

トップへ戻る