9 D' F1 f; y+ H t* i7 S政改攤牌漸近,當權派集結力量圍攻鍾民調。先是政協委員、恒地副主席李家傑發飆,公開指摘鍾氏經常在關鍵時刻發布對特府或北京不利的民調結果,操弄民意,為反對派開路。跟着,梁派網站《港人講地》發表編輯室文章〈解開特首民望「不合格」之謎〉,指鍾氏在最近的一個關於特首民望的民調裏取巧運用數據說謊,把一個好端端成績亮麗的特首說成多數人視為「不合格」。然後,梁派悍將、行會成員張志剛高調發言並在本周二《明報》撰文,引用上述網文核心內容,質問鍾氏「六成二給特首打50分或以上說明什麼?」【註1】TVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。, N$ g- b6 m# `
) s7 ~, k& F1 H結果,「六成二給特首打50分或以上」說明了《港人講地》編輯室文章有「小小」搞錯了基本統計方法,而「國師」張志剛懵然不知(?)並加小手腳發揮,結果鬧大笑話。 ; y- E- Y9 ~ e& r: a5 q) Ros.tvboxnow.comTVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。: z' x5 W* M, V
最先指出《港人講地》文章和張志剛說法有好幾個嚴重初等錯誤的,是一篇又一篇的網上及新媒體文章,作者都懂統計,卻是傳統媒體裏不見經傳的業餘評論者,可謂小孩大衞打死巨人高利亞,亦可謂:網絡世界,臥虎藏龍。本文將這些材料整理,歸納所指出的謬誤,並加若干己見,給大家參考。 # h, e7 g. k' B% T+ ^ 3 ?1 b4 G7 O1 L/ J4 p) L首先指出,張志剛文章(下稱「剛」文)的標題數字「62%」,與《港人講地》編輯室文章(下稱「講」文)同源,是一個發水或抽水幾近一倍的數字。「抽水」是指抽了民調回應者當中大批態度完全中立人士的水,把他們捆綁到梁特的支持者那邊,便成功創制出上述那個發水標題數字。過程中,還擅自替民調加上一個不適當的概念,對所導致的矛盾和足令梁特尷尬的結論卻諱莫如深。 ( ]6 e8 N# d. |( E5 xos.tvboxnow.comtvb now,tvbnow,bttvb+ }" h8 u/ `8 s) z2 `- F
' ?' S8 f8 Z# Z* Rtvb now,tvbnow,bttvb張志剛的「62%」發水近一倍 5 @3 `6 D' j9 i/ ITVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。公仔箱論壇$ _" I2 {9 }$ N% d
在港大鍾氏民調裏,特首「民望」數字的給定範圍是0-100,內含101個整數,50分居中。訪問到的998個回應者當中,有383個給特首打的分數低於50分,280個50分,335個高於50分。鍾民調事先給受訪對象說明: * L3 D& e j/ W4 j. ~8 u& f8 N( MTVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。 / k- l8 j4 E# Y2 f( e, H9 P「0分」為「絕對唔支持」,「50分」定義是「一半半」, 100分則為「絕對支持」。TVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。. Y; P6 b) `( T: L% M$ _* R
1 X5 M: f7 r9 x8 F& A! a公仔箱論壇 5 i" ^! M1 a) u P6 r$ O% H- |% E$ _公仔箱論壇( b6 V; O8 S" y. ~1 v
因此,對統計者而言,必須嚴格尊重那280個打50分者的中立態度,既不能把他們擺到383個不支持者那邊,亦不可將他們與335個梁特支持者放在一起;但是,「講」文捆綁抽水好自便,把打50分或以上的訪問對象加在一起(「一半半」+支持),一算:(280+335)/998= 62%,好亮麗! 3 G2 E, C1 i6 {* Z2 ?' O8 dos.tvboxnow.com2 q0 c8 o# n# P q" `# @$ Q* s4 M" h; h. t
然後張志剛就用這個數字說事,雄辯地問:這個數字「是合格還是不合格?」 + `+ m* ?1 d$ }7 ]1 d$ ~os.tvboxnow.com ]0 a) `+ c, ^0 \os.tvboxnow.com這就有趣了。因為這個算法如果說明特首民望是「嚴重地合格」,那麼,我們同樣可以把那280個態度中立打50分的受訪者加到「不支持者」那邊(「一半半」+唔支持),算出(280+383)/998= 66%。那不就表示梁特民望應該是「更嚴重地不合格」了麼? # T9 p5 b$ F( mTVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。os.tvboxnow.com; x. U/ h, s1 Z* [' K8 E" J
! e9 q7 e! ^8 ~% i矛盾兼尷尬!正如一篇網文題目所說:「你玩統計,統計玩你」。【註2】 " Y& {6 u: e9 K公仔箱論壇 & d5 y( ^( \, t4 ?* fos.tvboxnow.com任何公平的統計人,不會像「講」文那樣,抽那些回應「一半半」的態度中立人士的水,而只會用335/998= 34%這個數字,代表在原始數據裏支持梁特的回應者比率。這個數字,固然比不上發水幾近一倍的「62%」,與不支持梁特的回應者比率383/998= 38%相比,也差一截。如此,張志剛更應該雄辯地問問自己:34%這個數字,「是合格還是不合格?」 6 Z! O( y. P N: Y: N7 d1 O 7 i0 ?2 n3 t/ d1 G* m& n公仔箱論壇為何說事者可如此便給,大抽態度中立人士的水?因為中間做了幾近無縫的概念轉移。tvb now,tvbnow,bttvb* I; F: m' l# c5 p
os.tvboxnow.com; X$ ^, {$ L' ]8 ^
公仔箱論壇& K/ e* k K' o* M# u$ l
政治態度中立→「合格」→「支持」 * B2 V9 p) g# I% o6 H% R; p8 Ktvb now,tvbnow,bttvb 8 f9 V2 L- `7 m: d% e _- }) [TVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。大家如果留意,當可察覺「講」、「剛」二文其實歪曲了該次鍾民調裏的「50分」的定義,把政治態度上的中立(「一半半」)巧妙地改成「合格」。然而這個民調裏的50分,並非是一個「合格線」。os.tvboxnow.com+ Z* Q& C% w5 T9 ~7 Z$ o( P
8 ^3 O% L) M5 T% Z% c1 _( W. `. S
% ]$ v# B+ Y( T2 W
「合格」的標準人人不同。例如,筆者當年念的大學,合格線因教授而異;念津貼小學的時候,學校的合格分數是60%;中學則是40%,入讀後,老父不滿名校的標準反而那麼低,筆者卻認為好得很,因為可減輕功課做不好給老父指罵時的「殺傷力」。: {2 [: r( J6 V! ^5 s
公仔箱論壇: E7 h" {6 v2 T, U: E! [
然而,更重要的是,合格和支持不支持,其實沒有必然關係──例如,某醫學院專科生以40.1%的分數合格畢業,你支持不支持這位仁兄當你的心臟手術醫生?os.tvboxnow.com4 Y8 Q6 a! N3 b$ N6 U$ G
2 [" e) W& P% H% M1 V
$ z( W2 D1 R7 u2 B8 o, C: J; X
「講」、「剛」二文先將「50分」擅自定義為「合格」(與民調對象回答問卷時的指定意義不同),然後再把這個他們引入的「合格」概念等同民調裏的「支持」,這般偷換概念之後就可靜雞雞進行上述捆綁抽水。如此,「剛」文就可大剌剌地說:「評50分以上的比率就是62%,比49(分)以及以下的38%,多出一大截。」(注意:「50分以上的比率是62%」起碼應該是「50分或以上」罷?但連這個「或」字也省掉了。)如此逐步深入細緻地做群眾的思想擺布工作,不是第一次,大概也不會是最後一次。 9 l# [- M2 f* l V公仔箱論壇tvb now,tvbnow,bttvb/ b" @" g5 u8 l) V( l( k
公仔箱論壇, l0 H; e# @% b
事實上,港大民研計劃已再三聲明,「50分」與「合格」完全無關,指的是態度上的中立。當然,可以有另外的民調專講合格不合格,但這個梁特民望民調本身不適宜講,硬要講,就會出現上面的既矛盾也讓梁特相當尷尬的結論。這個民調只研究特首民望的平均分數高低;得出一個平均分數之後,合格與否,讀者可憑個人喜好各自解讀。大概有些人,就算梁特民望拿個1分平均分,也會認為他是合格的;邏輯上,這沒有問題,但如果濫用民調原始資料特別炮製一個「62%」來說事,就有問題。TVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。" P+ Y- R) B- s5 s/ @
% ~+ W* {% A, [: y0 \0 S* _5 Ctvb now,tvbnow,bttvbtvb now,tvbnow,bttvb+ V1 K- K0 S3 S# Q
剔除給0分的!保留給100分的! - B6 S: R% d7 dTVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。& u: h# K. W% z: k3 h
& k0 E, X- a l
所說何事呢?原來,「講」、「剛」二文說,既有「62%」這個亮麗數字,而鍾民調最後竟把梁特的平均民望評分算為47.5,必是因為鍾民調沒有把打0分的那些「極端分子」──即統計學上說的「離群數據」(outliers)──剔除。於是,他們就可結論:鍾民調不科學。這裏有三個問題。2 v( U7 I1 c; F1 `! q
: S2 P! {# \ X: P9 X9 u! v首先,如果要剔除給0分者,也應該剔除給100分者罷?但張志剛口中振振有辭的那個發水「62%」,卻隱蔽地包含了29個「100分」;這是「打茅波」。 , k2 x( i ~+ v8 v) t3 r+ ~公仔箱論壇os.tvboxnow.com# D! b# f8 L) [7 E# l
其次,已經有專家算出,把回應分數最高和最低的10%(含所有「0分」和「100分」)都剔除後,梁特民望平均值也好不了多少:48.1分,救不了他;用張志剛的話說,依然「不合格」。如此,大動干戈為的顯然不是兩個平均分48.1- 47.5 = 0.6分之差,因為「剛」文對此提都不提。那麼,要剔除91個「0分極端分子」,目的何在?不外起哄,令不諳統計學的人「覺得」鍾民調無理。但請繼續看無理的是誰。os.tvboxnow.com( {# O( r" g4 W
3 Z! I {' A8 c5 J1 Z! s1 Xos.tvboxnow.com . M o+ o5 V! {: ]+ ]5 v4 |■「港人講地」發表評論文章,質疑港大民調中特首評分為何不及格。 ; Z1 I9 M. g) z- x/ \tvb now,tvbnow,bttvb 7 i' k0 M0 A# ~; L6 R; P公仔箱論壇 $ q W+ T9 g- J& _: K. e網站「港人講地」上周五的評論文章《解開特首民望「不合格」之謎》指出,根據港大民意研究計劃(下稱「港大民研」)公佈的最新民調結果和原始資料,在998個被訪市民中,有615人給予特首梁振英50分或以上的支持度評分,即是有61.8%的被訪者給予合格分數。因此,港人講地提出質疑,既然有超過六成人評特首的表現有50分或以上,為何特首評分又會不合格呢?另外,港人講地認為港大民研計算特首的支持度平均分只得47.5分,這個不合格的評分是由於有91個被訪者給予0分的極端評分,因此將特首的平均評分拖低。os.tvboxnow.com- `6 i, ^8 A" k5 u H: v
3 t6 W- p! x( a% r. q4 h @
在港人講地發表這評論文章後,身兼行政會議成員及一國兩制研究中心總裁張志剛接受電子傳媒訪問,以港人講地一文的論點抨擊港大民研的調查準確性,他更形容在不少極端評分的影響下,用平均分來評核梁振英表現,猶如瞎子摸象。公仔箱論壇) o# G$ S* O' [$ a* m9 i
6 }& Y r7 X- @% ^; f3 RTVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。筆者在電視的新聞環節和幾份本地報章也看到港人講地和張志剛的批評,認為他們的指控相當嚴重,給予市民的感覺是港大民研有意將特首的支持度平均分拉低,對一間已成立多年的大學民調機構而言,是極大的侮辱。公仔箱論壇 I: C4 W7 _1 ]: v! Z
公仔箱論壇0 b' E$ Y, h3 J, }
筆者從事計量經濟研究,對統計方法頗有認識。因此對港人講地和張志剛的評論特別關心。既然港大民研已將民調的原始數據公開,作為學者,筆者認為有責任去仔細分析這份數據,以解釋疑團。tvb now,tvbnow,bttvb( \1 t) }3 _4 i; X4 }: r( u
: Z! z9 y. k& l* _& Tos.tvboxnow.com經過基礎的數據分析,竟然發現港人講地和張志剛均犯上一個非常初級的統計錯誤。主要問題是兩者在處理「中間點」50分數據時,在分組(grouping)上出現錯誤。首先,讀者可以細閱以下港大民研被質疑的民調問題:「而家想請你用0-100分評價你對特首梁振英的支持度,0分代表絕對唔支持,100分代表絕對支持,50分代表一半半,你會畀幾多分梁振英呢?」os.tvboxnow.com2 m, J$ D8 f- G$ c8 ?' K
5 w. J4 R& s# T, I0 F1 M0 jos.tvboxnow.com以上問題是聚焦於特首的支持度,量度分數是由最低的0分至最高的100分,即是總共有101個潛在得分(0,1,2,3,...98,99,100)。而50分剛好是中間點,但根據問題的措辭,50分只是代表「一半半」,沒有任何暗示這是一個合格的最低門檻。公仔箱論壇6 j, L2 {2 [+ m* ]; B" |1 h7 w
/ @0 w# V, n ]2 C! X$ h' _3 eos.tvboxnow.com關於港人講地和張志剛聲稱,有61.8%的被訪者評特首50分或以上。但經過筆者分析,這所謂61.8%的比例是來自將選擇50分的被訪者納入50分或以上的組別。但筆者可以告訴讀者,這分組步驟已犯上統計錯誤,因為這種方法可能會令到結果出現頗大偏差(Bias)。公仔箱論壇# U# [; z" V& i9 A, D4 H) V
2 @1 I1 @* y1 W8 Q% O/ A c以今次民調爭議為例,總評人數是998,包括383人評50分以下,280人評50分,和335人評50分以上。港人講地和張志剛將選擇評分的人分為兩組:0-49分和50-100分。但大家要留意0-49分只有50個選擇分數,而50-100分卻有51個選擇分數,這方法明顯給予50-100分的組別優勢了。但如果我們將分組改為0-50分和51-100分,這又會令0-50分的組別佔有優勢了。總言之,組別的處理方法是可以令到計算組別內的人數出現明顯分別,最終令結果出現偏差。tvb now,tvbnow,bttvb" P% Y, \; N$ D. W
- c- H1 F* ~/ \. f; M# A附表分別採用以上兩種方法去做分組。另外,筆者會使用一個常用的統計方法去處理這分組問題,從而得到一個較客觀和準確的答案。從附表中,讀者可以看到將評50分的人數納入其中一組會帶出截然不同的結論──將0-50分作為一組,即是將評50分的人數納入其中,結果將變為66.4%的被訪者評0-50分,與港人講地和張志剛的38.37%有明顯差距,這正好引證偏差對整個民調的影響。 - U1 Y8 K& I2 @3 _2 j0 z2 ~7 J $ C2 K7 U5 U+ eos.tvboxnow.com在統計學上,要妥善解決以上的偏差問題非常簡單。只要將一半評50分的人數放至0-50分組別,而另外一半的人數放在50-100分組別。這方法主要是平衡兩個組別的人數,以免出現過份偏差的情況(讀者可以參考ThomasWonnacott和Ronald Wonnacott的"Introductory Statistics For Business and Economics"(Fourth Edition)第二章腳註一)。如果利用這個「平均分配」的方法去處理分組,最終的答案仍是50分或以下的組別佔過半的百分比(52.4%),反映特首的支持度評分不是太理想。tvb now,tvbnow,bttvb5 K- @: O8 a% o+ h. y& a, g7 F
4 Q, L' `: R& S( e* s: C公仔箱論壇至於特首的平均分被拖低的問題,筆者同意港人講地和張志剛的論點,但我們分析的角度是有分別。他們認為太多人給予極端評分令到平均分下降是主因。從數學推論,這點是正確。但如果港大民研採用的民調方法是符合統計標準,這些極端評分也是反映香港人的民意。想想如果反對派投訴有太多人給予極高評分於特首,拉高了平均分,我們是否認為極高評分也是極端評分呢?對民意分析員來說,極高和極低的評分也是重要的統計資料。2 ~; \' B: Z9 N