ラベル 数量化Ⅱ類 の投稿を表示しています。 すべての投稿を表示
ラベル 数量化Ⅱ類 の投稿を表示しています。 すべての投稿を表示

2016年2月15日月曜日

文系でも分かる数量化Ⅱ類

数量化Ⅱ類とは、


1つの質的変数によって与えられたサンプル(個体)の群を、複数の質的変数(多変量データ)によって判別することです。

例:タバコを吸うか否かを、父親の喫煙習慣と本人の飲酒習慣によって判別(予測)する

複数の変数に重みを与え、その加重合計(合成変数)によって外的基準に基づく群を判別する「判別式モデル」を求めます。

判別式モデルの図

実際に分析の流れを見てみましょう。

分析データ(タイタニックの乗客データ)

タイタニックの乗客データ
タイタニックに乗っていた乗客のデータ

分析結果

タイタニックの乗客データから、生存する条件を導き出す。
数量化Ⅱ類の分析結果
ここでウエイトとして表現されているのが、生存条件に関わる要因です。
この場合は、客室では1等客室、年齢では子供、性別では女性という条件が、生存する条件に関わっています。
ここで注意することは、この値が高い⇒生存する確率が高いわけではありません。
今回は、この値が高い人が生存する結果になりました。

ウエイトとは?


このウエイトは、分析結果の振り分けがうまくいくために、各変数に与えた影響力です。
ウエイトトレーニングのウエイトです
重み=ウエイト
客室と年齢と性別の条件を基に、生死をうまく説明するために用意されたのがウエイトです。覚えておきましょう。