シナジーマーケティング株式会社

Menu

Webアクセス履歴から価値観の推論は可能か?

はじめに

私たちシナジーマーケティングは、 コーポレートステートメントでも述べている通り「最先端のマーケティングテクノロジーで、コミュニケーションをよりよくする会社」です。マーケティングとは、欲しい人に望み通りの商品・サービスが届き満足するという一連のプロセス、つまり質的な需給マッチング、これを追求することです。
その先に弊社代表の谷井の言う幸せな消費活動があると考えます。これを実現するために必要なのがマーケティングテクノロジーです。

テクノロジーの1つとして我々が考えているのが消費者行動予測です。消費者が、いつ、何を、どこで求めるのか、このようなことを予測するのが消費者行動予測です。この技術を確立することが我々の大きな目標の1つです。そのためには何が必要でしょうか。

まず、マーケティングの現状を考えてみましょう。
現在よく行われているのは、マスマーケティング、デモグラフィック情報によるマッチング、行動履歴そのもののマッチングあたりだと思います。デモグラフィック情報によるマッチングとは、性別や年代、あるいは住んでいる場所などを使ったマッチングです。例えば、この商品は20代の女性に売れているから20代の女性がよく見る雑誌、サイトに広告を出すというようなものです。
行動履歴そのもののマッチングとは、例えばAmazonのリコメンドのようなものです。この商品、あるいはこれらの商品を買った人はこの商品も買っていますというものです。

これらの手法は今後も有効なシーンがあるでしょう。しかし、これらの手法だけでは消費者行動予測を実現するには不十分だと我々は考えています。

そこで我々は価値観に注目し、1つの仮説を立てました。

“人の行動は価値観に基づく”

人は価値観に基づいて行動するとも言えます。この命題が真なら、価値観がわかれば行動予測が可能だと考えられます。

価値観を知るために必要なこと

では、価値観を知るためにはどうすればよいでしょうか。行動は価値観に基づくため、過去の行動、つまり行動履歴を分析することでわかりそうです。行動履歴にも色々あります。購買履歴、メールクリック履歴、Webアクセス履歴、SNSへの投稿などです。
これらを分析することで価値観がわかり、価値観がわかると行動予測ができるというわけです。購買履歴から未来の購買を予測することもできるでしょうし、購買履歴とWebアクセス履歴を分析し、メールクリックを予測することもできるでしょう。

そうすると、分析可能な履歴データの種類を増やすことが重要です。理由は2つあります。1つは消費者を多面的に分析できるようになり、精度が上がるからです。
人は多面性を持っています。オンとオフでの振る舞いが違うように、購買やメールクリックでも振る舞いは違うはずなので、購買履歴だけよりもメールクリック履歴やWebアクセス履歴など複数の履歴データを使ったほうが分析精度を高められます。

2つ目の理由は、分析可能対象を増やすことができるからです。ある人は購買履歴がないけれどもメールクリック履歴はある。ある人は購買履歴はあるけれどもメールクリック履歴がない。というような状況で、購買履歴しか分析対象にできない場合、後者のデータしか分析対象にできません。

そして、この分析可能な履歴データの種類を増やすことは社会知ネットワークにも繋がっていきます。本エントリーでは、履歴データの一つであるWebアクセス履歴から価値観による類型である Societasを推論することを試みる研究の現状について簡単に説明したいと思います。

Webアクセス履歴から価値観(Societas)を推測する

全体像

068_kitora_01_2

最初に2つの仮説をたてました。1つ目は、ユーザーが閲覧するWebページと興味のあるカテゴリーには関連があるというものです。2つ目は、興味のあるカテゴリーと価値観には関連があるというものです。間にカテゴリーをおくことで、Webページと価値観を関連付けました。

そして問題を2つのステップに分割しました。Step1はWebページのカテゴリー推論、Step2はカテゴリーから価値観、Societasの推論という問題です。

Step 1

068_kitora_01_3

全体の流れを上図に示します。
Webページに含まれる単語を抽出・選別し、単語からなるWebページのベクトルにします。それを分類器にかけてカテゴリーを判別するという流れです。カテゴリーはポータルサイトのカテゴリーを参考にし、政治・経済、料理・レシピなど合計38個定義しました。

分類器はカテゴリーの数だけ用意します。カテゴリーごとにWeb ページを50~60程度用意し、それを学習データとして機械学習で分類器を構築しました。

構築した分類器の精度を計測した結果が以下です。

  適合率 再現率 F 値
分類器 0.89 0.77 0.82
ランダム 0.03 0.50 0.06

いずれの値もランダムを明らかに上回っているため 、Webページのカテゴリー推論は可能だと考えます。

※適合率、再現率、F 値についてはこちらのページを参照ください。

Step 2

Webカテゴリーから価値観・Societasを推論するステップです。

Webカテゴリーと価値観を結びつけるデータが手元にはなかったため、アンケートを取得しました。アンケート内容は、興味のあるWebカテゴリーを聞くものとSocietasのミニアンケートです。

この結果から、このSocietas番号の人、この価値観を持っている人はこWebカテゴリーに興味があるというようなことがわかります。

ここではベイジアンネットワークを使いました。元々の価値観とSocietasのモデルにWebカテゴリーを追加し、アンケートで得たデータを学習データとしてモデル構築しました。

068_kitora_01_4

構築したモデルの精度評価結果は以下のとおりです。

  1位正解率 2位以上正解率 3位以上正解率
提案モデル 18.7% 33.5% 45.5%
ランダム 8.3% 16.7% 25.0%

ベイジアンネットワークの出力は確率分布です。つまり、Societas番号の#1-1が20%、#1-2が10% というように出力され、12のSocietas番号すべての確率を合計すると100%になるということです。

表の1位正解率とは推論結果の割合を降順に並べて1位となったものが正解だった割合、2位以上正解率とは推論結果の1位または2位が正解だった割合のことを言います。いずれもランダムの2倍程度の正解率ですので、WebカテゴリーからSocietasの推論は可能だと考えます。

まとめ

Step1、Step2の結果より、Webアクセス履歴からの価値観・Societas の推論は可能だと考えます。
この技術を使うことで、例えば、自社サイトの訪問者がどんな人なのかわかるかもしれません。
そうすると、ターゲットと実際の訪問者の人物像の差異を評価することが可能になります。この差異を理解し、ターゲットのペルソナを改善することで、よりターゲットに刺さるコンテンツ作成が可能になり、成果の出るWebサイト制作につなげることができます。

しかし、一方で課題もあります。
現状ではWebアクセス履歴とアンケートの両方が揃っている人のデータがないため、全体を通しての評価ができていません。また、ランダムより良いとはいえ、決して精度が高いとは言えないため、精度の向上も必要です。また、最初の仮定からひっくり返すことにはなるのですが、Webページと価値観の間におくのはカテゴリーで良いのかという疑問もあります。

まだまだ研究はこれからですが、可能性は示せているのではないかと思います。
研究が進みましたら、またご紹介したいと思います。

※記載されている内容は掲載当時のものであり、一部現状とは内容が異なる場合があります。ご了承ください。

お客様のことをより深く知るために。貴社独自の価値観マーケティングの実現を支援する、クラウド型社会知データベース「iNSIGHTBOX」

PageTop