今日はMacBookProでデータサイエンスを進めて行くシリーズの17回目となります。マーケティング領域で使えるデータサイエンス手法をテーマに記事を書いて行きます。今回は”コレスポンデンス分析”をご紹介していきます。是非最後まで読んでいって下さい!
- コレスポンデンス分析とは
- コレスポンデンス分析の種類
- コレスポンデンス分析の流れ
- コレスポンデンス分析のコツ
- コレスポンデンス分析関連の統計解析・機械学習アルゴリズム
- 注意点
1.コレスポンデンス分析とは
コレスポンデンス分析は、多変量解析の一つです。対象データを多次元集計し、その分析した結果を多次元にマッピングして、データ要素同士の関係性を可視化する分析手法です。要するに多次元のクロス集計の結果を図の中で表現する分析手法です。
<活用例>
例えばマーケティングにおいては、年齢や性別などの属性で商品や企業イメージをプロットして現状把握を行う、自社と他社の商品やブランドイメージをプロットとして現状把握を行うなどでよく利用されています。
2.コレスポンデンス分析の種類
コレスポンデンス分析は適応範囲が広く、扱うデータもカテゴリデータ(0と1データ)だけでなく、頻度等でも大丈夫です。
3.コレスポンデンス分析の流れ
以下、Excel等でも出来る一般的分析の流れです。
・対象データをクロス集計する
・結果をコレスポンデンス分析する(=図上にプロットする)
・結果を読み解く
4.コレスポンデンス分析のコツ
実際に分析する際の参考にして下さい。
1.軸に意味を考える。意味付けする
軸に意味付けした方が、結果の解釈がし易くなります。
2.関連性の強さと距離
関連の強いカテゴリは近くに、弱いカテゴリは遠くにプロットされますが、これはあくまでカテゴリ間の相対的な関係で、絶対的なボリュームを表わすものではない。
3.縦横のスケールは合わせる
縦軸と横軸のスケール(=目盛り)は出来るだけ合わせる。距離を見誤ら無いようにします。縦軸と横軸の選んだ軸の固有値、寄与率に注意する必要あり。
4.サンプルサイズが少ない際には要注意
クロス集計表から作成するため、サンプルサイズは結果に反映されません。サンプルサイズが少ない際には注意して下さい。
5.異なる項目の位置関係は、原点からの方向で判断する必要あり
異なる項目の位置関係は、原点からの方向で判断する必要があります。原点から見て同じ方向にあれば、一見距離があっても、同様の意味づけが可能です。
5.コレスポンデンス分析関連の統計解析・機械学習アルゴリズム
アルゴリズム名 | 概要 | Pythonライブラリ |
ー | コレスポンデンス分析用のライブラです。 | mca |
【参考」その他必要ライブラリ
アルゴリズム名 | 概要 | Pythonライブラリ |
ー | 可視化用のライブラリです。 | matplotlib |
ー | 可視化の結果を日本語対応させるためのライブラリです。 | japanize_matplotlib |
ー | データ加工用のライブラリです。 | pandas |
ー | テキストファイルの文字コードを検出するさいに役立つパッケージです。 | chardet |
6.注意点
Excel、pythonでもどちらでもそれ程難しく分析できますが、難しいの出た結果(=図)の解釈です。マーケティングで活用出来るためには、アクションに繋がる解釈が必要です。簡単ではありませんが、解釈こをが価値を産むと思いますので、色々試行錯誤してみて下さい。
今回は以上となります。最後まで読んで下さりありがとうございました。
コメント