SNSへの書き込みから「次に知りたい情報」をつかむ

このエントリーをはてなブックマークに追加
2017年07月06日

015.jpg

近年、通信環境の拡充・高速化によって、ウェブの閲覧履歴や行動履歴などのあらゆるデータを活用したマーケティングが試みられるようになってきました。多くの企業がSNSなどを通じて膨大なデータを収集し、活用しようとしていますが、華々しい成果があがったという話は聞いていません。

そこで、ここでは関係性技術を用いてSNSへの書き込みを分析し、その人に合ったニュースをレコメンドできるかどうかを見てみましょう。

使用するデータは次のとおりです。

  • ツイッターから収集した著名人5人のツイートのログ(ツイート日時とツイート内容を関係性技術で分析して、パーソナル関係性グラフを作成する)
  • 各種ニュースサイトから提供されているニュースの情報(各人のパーソナル関係性グラフを分析して、それぞれに合ったニュースを抽出する)

今回、検討に使用したのは次の3名です。

  • 有名人A、10代、歌手
  • 女性有名人B、20代、バラエティータレント
  • 女性有名人C、50代、IT企業経営者、男性

1.ニュースからグローバルな関係性、SNSからパーソナルな関係性を作る

まず、配信するニュースのテキストを形態素解析して、グローバル関係性グラフを作成します。このグローバル関係性グラフは、ニュースのテキストを形態素解析することで作成されます。

次に、それぞれのツイート・ログから関係性技術を使ってパーソナル関係性グラフを作成します。テキストデータから、関係性グラフをつくるためには、文章を形態素解析してノードを設定しなければなりません。

この形態素解析を自動で行うと「私」や「会社」などの一般名詞、「の」や「と」などの助詞の関係性が多く抽出されてしまいます。

そこで「つながりの数」が50より多くなったノードは、フィルタリングで除くことにしました。この「50」という数字は、実際の結果を見ながら決めたものです。

2.パーソナル関係性からその人の特徴を表すワードを抽出する

パーソナル関係性からその人の特徴を表すワードを抽出するために、、基点となるノードとして「イベント」を指定しました。これは、それぞれの関係性にある程度の統一性を持たせるためです。今回使用したサンプルデータはそれぞれ、イベントに出演することの多い著名人であるため、共通のノードとして「イベント」を選びました。

まず有名人A( 10代、歌手、女性)のツイートからは次のような関係性グラフが作成されました。基点ノードに「イベント」を指定し、距離の近い順に並べてあります。

有名人A のツイートから作成したパーソナル関係性グラフ
有名人A のツイートから作成したパーソナル関係性グラフ

このとき上位8位までのノードは、グローバル関係性グラフに存在しないモノだったので、9位の「六本木」をレコメンドのキーワードとして使うことにしました。

次に、有名人B(20代、バラエティータレント、女性)のパーソナル関係性グラフを作成したところ、次のようになりました。1位の「Ash」はグローバル関係性グラフに存在しないノードなので「風」をレコメンドのキーワードに使用することにしました。

有名人B のツイートから作成したパーソナル関係性グラフ
有名人B のツイートから作成したパーソナル関係性グラフ

次に、有名人C(50代、IT企業経営者、男性)のツイートからパーソナル関係性グラフを作成しました。グローバル関係性グラフに存在するノードを上から探したところ、6位の「朝」が該当したので、レコメンドのキーワードに使用することにしました。

有名人C のツイートから作成したパーソナル関係性グラフ
有名人C のツイートから作成したパーソナル関係性グラフ

3.グローバル関係性から個人の特徴を表すワードで抽出する

有名人A( 10代、歌手、女性)のパーソナル関係性グラフから抽出されたノード「六本木」と、共通ノードの「イベント」を、ニュースからつくったグローバル関係性グラフに入れて、新たなノードを抽出します。

有名人A のパーソナル関係性グラフから作成したグローバル関係性グラフ
有名人A のパーソナル関係性グラフから作成したグローバル関係性グラフ

4.抽出されたワードに紐づくニュースを取得する

これらのキーワード(ノード)を含むニュースとして、有名人A( 10代、歌手、女性)にレコメンドされたのが、次のニュース群です。

有名人A にレコメンドされたニュース
有名人A にレコメンドされたニュース

完璧というわけではありませんが、それなりにばらつきもありつつ、興味深いニュース構成になっていると感じます。

2位の「GW真っ只中に一人で遊園地に行ってみた」とか11位の「セレブの人気リアルクローズが銀座に新ショップ」とか、14位の「スイーツ食べ放題のバイキング店『スイーツパラダイス』の魅力って?」などが、それらしいニュースになっています。

一方で、3位の「アンチエイジングのヒント」や6位の「昭和電工子会社 包材の生産能力増強」などはミスマッチかもしれません。

同様にして、有名人B(20代、バラエティータレント、女性)にレコメンドされたニュースは次のとおりです。

有名人B にレコメンドされたニュース
有名人A にレコメンドされたニュース

1位の「夏にピッタリ! "加熱"するアイスって?」とか、2位の「PSY、米オーディション番組決勝戦で公演へ」とか、上位にうまくマッチしたニュースがきています。

では、有名人C(50代、IT企業経営者、男性)にレコメンドされたニュースを見てみましょう。

有名人C にレコメンドされたニュース
有名人C にレコメンドされたニュース

1位の「Nexyz.BB Web Mail を騙るフィッシングサイトが出現」、3位の「『強制歳出カット』回避失敗なのに、どうして株高なのか?」など、上位に、ぴったりのニュースがきているようです。

このように、それぞれのツイートを関係性技術で分析することで、まったく異なるノードが作成され、それをもとにそれぞれ異なるニュースをレコメンドできることがわかりました。しかも、そのニュースは個人のパーソナリティにかなり関係したものを抽出できるといえそうです。

つまり、書き込みからパーソナライズされた情報を抽出できるうえ、その情報とコンテンツ情報をつなげることで、個人に合わせたコンテンツを決定できるサービスが、関係性技術で実現できることがわかります。

今回は、書き込みの多い有名人のツイッターをサンプルとして用いていますが、将来的にはスマホに入力された文字(メールやウェブサイトの検索、書き込み)などから、それぞれのスマホの持ち主へのパーソナライズされたレコメンデーションが可能になると私たちは考えています。

前回:ローコストで手軽な高精度のレコメンデーションシステム

次回:カーナビの移動履歴から、その人に合った情報を提供する

関係性コラムトップ

トップへ戻る