& C; U, r4 e3 C7 r2 q( |TVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。公仔箱論壇8 |9 z7 X! V Q; b" }
tvb now,tvbnow,bttvb" v. z7 j0 g& V; u( ]
因此,對統計者而言,必須嚴格尊重那280個打50分者的中立態度,既不能把他們擺到383個不支持者那邊,亦不可將他們與335個梁特支持者放在一起;但是,「講」文捆綁抽水好自便,把打50分或以上的訪問對象加在一起(「一半半」+支持),一算:(280+335)/998= 62%,好亮麗! ; B7 E* g! B F3 C: D2 lTVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。os.tvboxnow.com" [# O8 Q( I: v' U; y D) `
然後張志剛就用這個數字說事,雄辯地問:這個數字「是合格還是不合格?」TVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。0 q6 t+ s2 Y/ t
3 N, ^% i9 T1 [os.tvboxnow.com這就有趣了。因為這個算法如果說明特首民望是「嚴重地合格」,那麼,我們同樣可以把那280個態度中立打50分的受訪者加到「不支持者」那邊(「一半半」+唔支持),算出(280+383)/998= 66%。那不就表示梁特民望應該是「更嚴重地不合格」了麼?os.tvboxnow.com5 q& \4 |% w0 H( E% M; A
! t; r) J/ w( _os.tvboxnow.com% M3 k& k5 g1 U h$ B7 w i3 w TVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。0 e, ]8 y2 M! i. N" o4 n6 b
■「港人講地」發表評論文章,質疑港大民調中特首評分為何不及格。os.tvboxnow.com/ [- k: ]$ l8 g
( f# D/ v# `) h6 a f- Ytvb now,tvbnow,bttvbtvb now,tvbnow,bttvb8 e. W& B S1 F8 j& }
網站「港人講地」上周五的評論文章《解開特首民望「不合格」之謎》指出,根據港大民意研究計劃(下稱「港大民研」)公佈的最新民調結果和原始資料,在998個被訪市民中,有615人給予特首梁振英50分或以上的支持度評分,即是有61.8%的被訪者給予合格分數。因此,港人講地提出質疑,既然有超過六成人評特首的表現有50分或以上,為何特首評分又會不合格呢?另外,港人講地認為港大民研計算特首的支持度平均分只得47.5分,這個不合格的評分是由於有91個被訪者給予0分的極端評分,因此將特首的平均評分拖低。 + u4 L- d5 u0 L7 V: K5 \公仔箱論壇+ O( g6 {: r$ f+ Z
在港人講地發表這評論文章後,身兼行政會議成員及一國兩制研究中心總裁張志剛接受電子傳媒訪問,以港人講地一文的論點抨擊港大民研的調查準確性,他更形容在不少極端評分的影響下,用平均分來評核梁振英表現,猶如瞎子摸象。 / M, W" w# K4 s% g, Nos.tvboxnow.comtvb now,tvbnow,bttvb2 A; E/ j B# l# j) w. n: E$ A C
筆者在電視的新聞環節和幾份本地報章也看到港人講地和張志剛的批評,認為他們的指控相當嚴重,給予市民的感覺是港大民研有意將特首的支持度平均分拉低,對一間已成立多年的大學民調機構而言,是極大的侮辱。 9 ^( y$ k% ^( u9 H/ d4 Uos.tvboxnow.com公仔箱論壇1 F5 l j8 k% [
筆者從事計量經濟研究,對統計方法頗有認識。因此對港人講地和張志剛的評論特別關心。既然港大民研已將民調的原始數據公開,作為學者,筆者認為有責任去仔細分析這份數據,以解釋疑團。 . H4 ~4 J6 d# M+ i" \+ l% [+ R3 W% {) ftvb now,tvbnow,bttvb - P% x/ a, i- xTVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。經過基礎的數據分析,竟然發現港人講地和張志剛均犯上一個非常初級的統計錯誤。主要問題是兩者在處理「中間點」50分數據時,在分組(grouping)上出現錯誤。首先,讀者可以細閱以下港大民研被質疑的民調問題:「而家想請你用0-100分評價你對特首梁振英的支持度,0分代表絕對唔支持,100分代表絕對支持,50分代表一半半,你會畀幾多分梁振英呢?」 % B# S& R4 C$ z6 U1 V- ?$ KTVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。/ S) Y* A" I A
以上問題是聚焦於特首的支持度,量度分數是由最低的0分至最高的100分,即是總共有101個潛在得分(0,1,2,3,...98,99,100)。而50分剛好是中間點,但根據問題的措辭,50分只是代表「一半半」,沒有任何暗示這是一個合格的最低門檻。 : F8 i0 T( r( Z! Y0 Z4 Q2 U 9 O9 _/ r4 a3 [/ s7 P0 C. U& hos.tvboxnow.com關於港人講地和張志剛聲稱,有61.8%的被訪者評特首50分或以上。但經過筆者分析,這所謂61.8%的比例是來自將選擇50分的被訪者納入50分或以上的組別。但筆者可以告訴讀者,這分組步驟已犯上統計錯誤,因為這種方法可能會令到結果出現頗大偏差(Bias)。 $ P' x1 M2 L) @+ b! n公仔箱論壇 " z! M n( d$ W' c7 F# h: T" m公仔箱論壇以今次民調爭議為例,總評人數是998,包括383人評50分以下,280人評50分,和335人評50分以上。港人講地和張志剛將選擇評分的人分為兩組:0-49分和50-100分。但大家要留意0-49分只有50個選擇分數,而50-100分卻有51個選擇分數,這方法明顯給予50-100分的組別優勢了。但如果我們將分組改為0-50分和51-100分,這又會令0-50分的組別佔有優勢了。總言之,組別的處理方法是可以令到計算組別內的人數出現明顯分別,最終令結果出現偏差。 9 }2 G; k; o- U+ k+ B$ ]公仔箱論壇 - z! D7 j( o% y5 U8 B+ ros.tvboxnow.com附表分別採用以上兩種方法去做分組。另外,筆者會使用一個常用的統計方法去處理這分組問題,從而得到一個較客觀和準確的答案。從附表中,讀者可以看到將評50分的人數納入其中一組會帶出截然不同的結論──將0-50分作為一組,即是將評50分的人數納入其中,結果將變為66.4%的被訪者評0-50分,與港人講地和張志剛的38.37%有明顯差距,這正好引證偏差對整個民調的影響。 ( X4 S, B+ ?4 P) o8 D 5 S2 h" m* R, B2 w; ?3 e在統計學上,要妥善解決以上的偏差問題非常簡單。只要將一半評50分的人數放至0-50分組別,而另外一半的人數放在50-100分組別。這方法主要是平衡兩個組別的人數,以免出現過份偏差的情況(讀者可以參考ThomasWonnacott和Ronald Wonnacott的"Introductory Statistics For Business and Economics"(Fourth Edition)第二章腳註一)。如果利用這個「平均分配」的方法去處理分組,最終的答案仍是50分或以下的組別佔過半的百分比(52.4%),反映特首的支持度評分不是太理想。 ( C g, D4 @* w, s; }: Z+ U8 u公仔箱論壇TVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。9 ^; x" y2 s: Z7 Q
至於特首的平均分被拖低的問題,筆者同意港人講地和張志剛的論點,但我們分析的角度是有分別。他們認為太多人給予極端評分令到平均分下降是主因。從數學推論,這點是正確。但如果港大民研採用的民調方法是符合統計標準,這些極端評分也是反映香港人的民意。想想如果反對派投訴有太多人給予極高評分於特首,拉高了平均分,我們是否認為極高評分也是極端評分呢?對民意分析員來說,極高和極低的評分也是重要的統計資料。- E9 g/ h% u6 W( H
. ~) X/ W) A2 X9 n. N' A但一旦出現很多人選擇極高或極低評分,以平均分來分析民意的變化的確不是一個最好的指標。原因是評分分佈不是一個正態分佈(Normal Distribution)。因此,更好的「中間位指標」可以考慮採用中位數(Median)或眾數(Mode)等統計指標,筆者提議港大民研在發佈民調結果時可以同時公佈中位數和眾數,務求令公眾有更多資料以了解特首的支持度。以這次民調的數據為例,中位數和眾數均是50分,較平均分47.5分只高了2.5分。os.tvboxnow.com6 F& t1 ~& _4 b
tvb now,tvbnow,bttvb' ^$ w% @# \- ]# u# \, J; m4 N S
另一個處理方法是剔除極高或低評分部份,從而計算「截尾均值」(Trimmed mean)。筆者(關焯照)在中大任教時,也曾負責老師的課程評價(course evaluation)。在報告老師的課程評價時,筆者會同時公佈兩組結果:用所有學生的評分計算平均分和剔除極端評分後的截尾均值,老師可以參考兩組結果從而改善教學技巧。tvb now,tvbnow,bttvb. I. R- c0 m" f+ o/ w2 Q0 y