-
-
判別分析
來源:默認管理員點擊數:344發布時間:2012-12-101 基本概念:判別分析(Discriminant Analysis)是根據觀測到的某些指標對所研究的對象進行分類的一種統計方法。進行判別分析時,通常是根據已掌握的一批分類明確的樣品建立判別函數、分類的規則,然后將待分類的樣品的實測值代入該函數,求出其函數值,并據此作出判斷。按數學原理,判別分析分概率型、非概率型兩類方法。常用的判別分析方法主要包括:Bayes準則下的判別分析、Fisher準則下的判別分析。
2 基本原理
Bayes準則:設有g個分類明確的總體π1,π2,πg,分別為x1,x2,…,xp 的多元正態分布。對于任何一個個體,若已知p個變量的觀察值,要求判斷該個體最可能屬于哪一個總體。在某一分類規則下,我們把實屬第i類的個體錯分到第j類的概率記為P(j|i),這種錯分造成的損失記為C(j|i)。那么,在這個判別分類規則下,實屬第i類個體錯分到其他類別的總損失為
記第i類個體出現的概率為P(π1),從而這個判別分類規則錯分的平均損失為
Bayes判別準則是:平均損失最小化。按照這一準則尋找判別分類的方法,稱為Bayes判別分析。
Fisher準則:
對兩類判別,對任意一組常數(a1,a2,…an),構造線性函數,
Z=a1X1+a2X2+…+anXn
在條件
最大的原則下,獲得判別函數。
其中,
、
為兩組的Z得分, 為兩組Z得分方差的聯合估計。
對多類判別,尋找滿足矩陣方程
[B-λW]A=0
的系數矩陣。其中B為類別間的方差-協方差矩陣,W為類別內的方差-協方差矩陣。
判別分析應用示例
在一項市場細分研究中,經過研究(如:聚類分析等),將被訪者分為3類,Bayes準則下的判別函數為:
P1= -3.5+0.52 age+12.5vision+3.3at+0.036bv+0.564qpv
P2= -1.5+0.65 age+10.3vision+3.8at+0.022bv+0.415qpv
P3= -8.5+0.85 age+13.5vision+1.3at+0.006bv+0.612qpv
Fisher準則下的判別函數為:
D1= -2.5+0.12 age+6.5vision+2.3at+0.12bv+0.35qpv
D2= -4.4+0.25 age+5.3vision+3.5at+0.05bv+0.65qpv
相應的Territorial Map圖為: