【第10回】MacBookProで始めようデータサイエンス ~統計基礎4 ”共分散構造分析・生存時間分析”~

ツール・手法

今日はMacBookProでデータサイエンスを進めて行くシリーズの8回目となります。今回はデータサイエンス、データサイエンティストにとって必須となる”統計基礎”についてご紹介していきます。今回は”多変量解析3”を扱います。是非最後まで読んでいって下さい!

  • 統計とは
  • データの種類と尺度
  • 記述統計
  • 検定
  • 多変量解析
  • 共分散構造分析
  • 生存時間分析

6.共分散構造分析
 共分散構造分析とは、共分散と呼ばれる数値を利用して、互いに関連を持つ複数の要素間の関係性やその程度をモデル化する多変量解析の一つです。英語では、SEM:Structural Equation Modelingです。主にはマーケティングの分野、社会学、心理学の分野で活用されています。回帰分析や因子分析は共分散構造分析の一部とも言えるようです。ある変数が別の変数に影響を与えることや、ある観測変数がある潜在変数から影響を受けることなどを扱います。

【活用例】
・商品やブランドのリピート率を高めるには、ブランド力やロイヤリティを高める必要があるという仮説を立てます。仮説が正しいのか、正しいとすればどの程度の強い関連性があるのか共分散構造分析を使って解析して行きます。

7.生存時間分析
 生存時間分析とは、イベントが起きるまでの時間とイベントとの間の関係に焦点を当てる統計解析手法の一つです。 主には製造業では機械システムや製品の故障などを、医学においては疾患の病気の再発や死亡などを対象とした研究分野活用されています。

【活用例】
顧客の離反への活用として、離脱しそうな顧客の予測に生存時間分析を用いるケースがいくつか報告されています。

【代表的な生存時間分析】
コックス比例ハザード分析
 年齢や性別などの説明変数の効果を説明する生存データの分析(回帰分析)によく使われています。

コックス・マンテル検定
 生命表のデータを対応のある2分類データと考え、繰り返しのある二元配置分散分析同様の方法により、累積生存率曲線全体を群間比較します。

カプランマイヤー生存曲線
 生存率曲線を描くことで生存時間の推定を行います。また、死亡発生ごとに生存率を計算するので、少数例の場合にも正確な生存率を求めることが出来ます。


今回は以上となります。最後まで読んで下さりありがとうございました。

コメント

タイトルとURLをコピーしました