今日はMacBookProでデータサイエンスを進めて行くシリーズの11回目となります。実務で使えるデータサイエンス手法をテーマに記事を書いて行きます。是非最後まで読んでいって下さい!
- マーケティングにも活用し易い手法8選
- 統計
- 決定木・ランダムフォレスト
- 勾配ブースティング木
- クラスター分析
- コレスポンデンス分析
- コンジョイント分析
- テキストマイニング
- アソシエーション分析
0.実務に活用し易い手法8選
今回は”マーケティング✖️データサイエンス”というテーマで、マーケティングに利用できるデータサイエンス手法を”8つ”ご紹介していきます。
1.統計分析
統計分析は、
記述統計、検定、多変量解析、共分散構造分析、生存時間分析等があります。
中でもマーケティングでは、検定はおさえておいても良いと思います。検定はデータ仮説が統計的に正しいかどうかを確かめる際に使用します。
<活用例>
・LPを比較してどちらが良いのかを比較したい
・実施した施策はどちらが良いのかを比較したい
※どちらも仮説に基づいて実施したものの効果測定をする際に有益です。
2.決定木・ランダムフォレスト
木構造で分類していく特徴があり、分かり易いためビジネス場面でしばしば利用されている手法の一つです。ただし、精度が余り高く無いため最終報告時に使用しない方が良いです。ランダムフォレストについはまた別途詳細を記載します。
[予備知識]
一番親の分岐前のものを”ルートノード”、木構造で別れた先を”ターミナルノード”と呼びます。
3.勾配ブースティング木
決定木の発展系です。決定木の精度の低さをアンサンブル学習で精度を高めたのが、この勾配ブースティング木になります。
[補足説明]
勾配ブースティングでは、直列で決定木モデルを作って前の決定木で上手く処理出来なかったところに焦点を当てて次の決定木で改善し、それを繰り返していくイメージです。
勾配ブースティング木には、幾つも有名なアルゴリズムがありますが、最も有名なのが”LightGBM”になります。他のものと比べて計算負荷が低く高速処理できます。
4.クラスター分析
教師無し学習に属しており、ある属性などに基づいて顧客を分類したい場合に有効な手法です。
上手く行けば新たな顧客層をデータ上から発見することが出来る可能性があります。
[予備知識]
階層的クラスター分析と非階層的クラスター分析は、データ量が多い場合は、非階層的クラスター分析が向いていると言われています。ただし非階層的クラスターは任意でいつくに分類するかを人が決める必要があるため”恣意的になる”という欠点があります。
クラスター分析で得られたセグメント情報を回帰分析へ適用することによって、モデル精度向上に繋げることも可能です。
5.コレスポンデンス分析
多変量解析の一つでアンケートデータの可視化でもよく使われている手法の一つです。
<活用例>
・商品やサービスの特徴を可視化したい
→他社製品と比較したアンケートを作ってもらい、それを比較し結果をプロット(=マッピング)するような使用方法です。
※マーケティングや調査では良く利用されています。結果をプロット(=マッピング)することで相対的に特徴を捉えることが可能になります。
6.コンジョイント分析
商品やサービスのどの部分を改善するば消費者に刺さるのかを把握するための手法です。例えばスペックや価格については消費者側も明確に意識や分かっている訳ではありません。このように消費者の潜在的な意識をアンケートなどを通じて”スコア付け”をおこなことによって把握し易くするのがコンジョイント分析になります。これによって過剰なスペック、価格、サービスを提供しないようにすることなどで活用されています。
7.テキストマイニング
日本語、英語などの自然言語で書かれた文章を統計的に分析する手法です。
<活用例>
・お客様に実施したアンケートの結果の分析
・コールセンターで受け付けたお声の分析
8.アソシエーション分析
アソシエーション分析は、関連性を分析する統計解析・機械学習の手法です。膨大なデータの中から関連性の強い組み合わせや意味のあるパターンを発見する際に役立ちます。
<活用例>
主には顧客毎に、その顧客が購入した商品購買歴を付与します。それを他の顧客とまとめて分析することによって連性の強い組み合わせや意味のあるパターンを発見します。
ID-POSデータ、通販などで良く利用されています。
[参考情報]
マーケットバスケット分析は単に”バスケット分析”という名称で呼ばれることがあります。アソシエーション分析=バスケット分析と思っていただいても特に問題はありません。
今回は以上となります。最後まで読んで下さりありがとうございました。
コメント