3 u t# y9 `7 J b* O筆者從事計量經濟研究,對統計方法頗有認識。因此對港人講地和張志剛的評論特別關心。既然港大民研已將民調的原始數據公開,作為學者,筆者認為有責任去仔細分析這份數據,以解釋疑團。 ) M+ l4 U* s2 @4 Ptvb now,tvbnow,bttvb9 J/ y3 m v/ J+ W) O
經過基礎的數據分析,竟然發現港人講地和張志剛均犯上一個非常初級的統計錯誤。主要問題是兩者在處理「中間點」50分數據時,在分組(grouping)上出現錯誤。首先,讀者可以細閱以下港大民研被質疑的民調問題:「而家想請你用0-100分評價你對特首梁振英的支持度,0分代表絕對唔支持,100分代表絕對支持,50分代表一半半,你會畀幾多分梁振英呢?」 9 R. q. p1 a, M/ b- h" N4 MTVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。 - m' ?" F5 m( v0 P0 g/ f5 `& m以上問題是聚焦於特首的支持度,量度分數是由最低的0分至最高的100分,即是總共有101個潛在得分(0,1,2,3,...98,99,100)。而50分剛好是中間點,但根據問題的措辭,50分只是代表「一半半」,沒有任何暗示這是一個合格的最低門檻。# I% }# e, P) m" S! X4 ^+ o
* T& A) C! K' u z7 u關於港人講地和張志剛聲稱,有61.8%的被訪者評特首50分或以上。但經過筆者分析,這所謂61.8%的比例是來自將選擇50分的被訪者納入50分或以上的組別。但筆者可以告訴讀者,這分組步驟已犯上統計錯誤,因為這種方法可能會令到結果出現頗大偏差(Bias)。os.tvboxnow.com8 [. A+ H( {' ~- F$ S6 W
; H' P" j% Q& R# z# Y! N0 [tvb now,tvbnow,bttvb以今次民調爭議為例,總評人數是998,包括383人評50分以下,280人評50分,和335人評50分以上。港人講地和張志剛將選擇評分的人分為兩組:0-49分和50-100分。但大家要留意0-49分只有50個選擇分數,而50-100分卻有51個選擇分數,這方法明顯給予50-100分的組別優勢了。但如果我們將分組改為0-50分和51-100分,這又會令0-50分的組別佔有優勢了。總言之,組別的處理方法是可以令到計算組別內的人數出現明顯分別,最終令結果出現偏差。 & G$ P8 u" b5 wTVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。os.tvboxnow.com! n K! f8 ^% F8 Q5 S
附表分別採用以上兩種方法去做分組。另外,筆者會使用一個常用的統計方法去處理這分組問題,從而得到一個較客觀和準確的答案。從附表中,讀者可以看到將評50分的人數納入其中一組會帶出截然不同的結論──將0-50分作為一組,即是將評50分的人數納入其中,結果將變為66.4%的被訪者評0-50分,與港人講地和張志剛的38.37%有明顯差距,這正好引證偏差對整個民調的影響。tvb now,tvbnow,bttvb' B3 ?. A# h- w9 w/ \$ G
. g! n, i U3 y7 c
在統計學上,要妥善解決以上的偏差問題非常簡單。只要將一半評50分的人數放至0-50分組別,而另外一半的人數放在50-100分組別。這方法主要是平衡兩個組別的人數,以免出現過份偏差的情況(讀者可以參考ThomasWonnacott和Ronald Wonnacott的"Introductory Statistics For Business and Economics"(Fourth Edition)第二章腳註一)。如果利用這個「平均分配」的方法去處理分組,最終的答案仍是50分或以下的組別佔過半的百分比(52.4%),反映特首的支持度評分不是太理想。 ; w: }2 g1 [ \; v; [* R' Ntvb now,tvbnow,bttvb & F% W& y" Y0 ?5 [* v$ QTVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。至於特首的平均分被拖低的問題,筆者同意港人講地和張志剛的論點,但我們分析的角度是有分別。他們認為太多人給予極端評分令到平均分下降是主因。從數學推論,這點是正確。但如果港大民研採用的民調方法是符合統計標準,這些極端評分也是反映香港人的民意。想想如果反對派投訴有太多人給予極高評分於特首,拉高了平均分,我們是否認為極高評分也是極端評分呢?對民意分析員來說,極高和極低的評分也是重要的統計資料。 ! p% k9 O1 ]. M/ ITVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。公仔箱論壇. U) D' {! F8 E
但一旦出現很多人選擇極高或極低評分,以平均分來分析民意的變化的確不是一個最好的指標。原因是評分分佈不是一個正態分佈(Normal Distribution)。因此,更好的「中間位指標」可以考慮採用中位數(Median)或眾數(Mode)等統計指標,筆者提議港大民研在發佈民調結果時可以同時公佈中位數和眾數,務求令公眾有更多資料以了解特首的支持度。以這次民調的數據為例,中位數和眾數均是50分,較平均分47.5分只高了2.5分。 2 j4 o$ {; R3 A# l e, stvb now,tvbnow,bttvb" ?" ?" W- N6 @( h& D+ D- P
另一個處理方法是剔除極高或低評分部份,從而計算「截尾均值」(Trimmed mean)。筆者(關焯照)在中大任教時,也曾負責老師的課程評價(course evaluation)。在報告老師的課程評價時,筆者會同時公佈兩組結果:用所有學生的評分計算平均分和剔除極端評分後的截尾均值,老師可以參考兩組結果從而改善教學技巧。tvb now,tvbnow,bttvb( H$ r5 @+ `6 F7 z' h
0 ~8 m, c8 M- C! I
民調是一個非常有用的統計學方法了解公眾的觀感(gauge public perception),但一旦在計算上出現如港人講地和張志剛等犯上的初級統計錯誤,便很容易得到錯誤的結論,大家應該引以為誡。 2 i& ]8 ?0 {+ C; G4 `' v" f; ?# Mos.tvboxnow.comos.tvboxnow.com4 z. @# g: o f3 V9 H4 ^
) C) e8 g' R" A% O2 u
關焯照 8 Q7 B, }- s" ~9 [6 j: w公仔箱論壇: y- y& {" y1 U: U& S/ U1 Q
經濟學家公仔箱論壇2 Q' _' A% D7 J% d6 R: K K; F) M
冠域商業及經濟研究中心主任 7 D1 k$ y; a8 u5 W2 wtvb now,tvbnow,bttvbos.tvboxnow.com& D9 y0 W* w# C; M N
2 m8 M; F. R' v
周文林2 {- ?/ c- j; O- g9 w1 l; J
/ v) W T+ v3 z8 Q/ m6 J公仔箱論壇經濟學家 ! t1 d# ^' T8 w: |9 a. Ctvb now,tvbnow,bttvb冠域商業及經濟研究中心高級研究員os.tvboxnow.com1 K. ]/ Z, _! ~0 \
tvb now,tvbnow,bttvb: C1 c/ G* o: C0 U% Q1 L