親王

Rank: 17

1^#

字體大小: tT

發表於 2016-3-13 09:55 AM | 只看該作者

[時事討論] 安裕周記﹕問誰領風騷

本帖最後由 felicity2010 於 2016-3-13 09:58 AM 編輯 os.tvboxnow.com( v4 K) R' L* E1 a" A' f; I" N
' H# ?; \; ]* U, X8 m
安裕周記﹕問誰領風騷tvb now,tvbnow,bttvb: z4 t1 ~5 z4 v% r

　南韓棋手李世石與電腦AlphaGo的五局大戰，到星期六已是來到第三場，下筆之時距離開賽還有兩個鐘頭，李世石能否扳回一城，不致在這場「五番碁」比賽連輸三場敗北，是這個星期六令人懸念的一件事情。星期三第一場交手，李世石中盤犯了一個錯誤，被對手抓住機會砍旗拔寨；第二場李卻太過小心謹慎，時間幾乎用光，再丟一局。在互聯網上觀棋的棋友都為李世石打氣，有促狹的更開了一個小玩笑，在facebook貼上帖子，「李師傅，不要跟它拼棋，嘗試切它電路」，在人與電腦決戰落後的低氣壓下帶來一絲歡笑聲音。根據「五番碁」安排，先取三局者勝，星期六下午恐怕人心都黏在首爾，一局定勝負，還看今朝。! ?" F5 ]# n! r( J* X9 z

　世界三大圍棋強國，中國大陸是這次大戰的塘邊鶴，職業棋手排行榜暫列第一的柯潔公開說「AlphaGo贏不了我」；原因是柯曾擊敗李世石，所以可以戰勝電腦對手。若電腦打敗李世石後與柯潔接戰，應該是好戲連場，不過這都是後話。令人納罕的是日本棋壇的沉默，傳媒報道不算鋪天蓋地，也許是沒有日本棋手參戰，那種默然不免讓人覺得有點怵。儘管中韓棋手崛起，人們的目光依然在日本七大圍棋頭銜打轉，由年頭的棋聖，到接續下來的十段，本因坊，碁聖，名人，王座，乃至於年底的天元，這些曾經或現在依然是喜歡下圍棋朋友的焦點。可是在李世石紋秤對座或者柯潔意氣風發之間，日本卻像在另一個時空，遠離地球。- @2 `; m# F2 G' {+ e* f" U* S8 A, e

電腦能否打敗棋王，在IBM電腦「深藍」於一九九七年取勝國際象棋棋王卡斯巴羅夫，客觀上得到第一個證明。到了被認為更複雜的圍棋，經過二十年間的發展，人工智能是否有更長足進步，在李世石對戰之後可能得出結論。這裏說「可能」，是因為牽涉李世石是否全力出戰，這並非說李世石保留實力馬虎上陣，而是他有沒有汲取敗仗經驗調整戰略，再次面對熟悉他棋路的陌生對手。毋庸置疑，AlphaGo必定像棋手賽前打譜那樣，把所有李世石的棋局輸入，以強大的CPU高速運算，從而提出下子方案。當然今天的AlphaGo比二十年前的深藍必然大幅提升，有一種說法是AlphaGo可以在運算之外因着棋局大勢作出最有利的佈局，而非一子一石的逐步解構。我不是AlphaGo的工程師，無以回應這些說法，不過，若是以李世石的棋譜分析，再根據現場下子作出判斷，這是正常不過的做法。問題是，李世石會被AlphaGo牽着鼻子走，抑或他可以反客為主，以新套路把電腦牽着鼻子走。
& n, U" K  I& Y6 E
　李世石會牽着電腦走？# T' \; {3 K1 ]6 |

南韓棋手戰後異軍突起第一人是旅日的趙治勳，上世紀七十年代末八十年代初，日本以及世界棋壇仍然佯倘在木谷實弟子加藤正夫的時代，趙治勳以中盤凌厲搏殺異軍突起，在一九八二年一口氣拿下十段、本因坊及名人三大頭銜，與加藤正夫、大竹英雄三分天下，也為其後多年的「趙治勳——小林光一」年代擘劃各自勢力版圖。這也是另一場棋壇佳話的開始，小林光一是木谷實的關門弟子，木谷實把女兒禮子許配給小林光一，希望師姐照顧好天份極高的師弟，為木谷實道場繼續揚名立萬，趙治勳則是以同門師兄弟的身分與小林光一兩人瓜分天下。
, i3 Q! n- L3 H, s* E; r7 s
　趙治勳的冒起帶來強悍至今的韓流勢力，韓國棋手不如日本講究華麗佈局的「宇宙流」，也不是中國大陸棋手擅於中盤發力的「中國流」，而是自行其事、日本棋評家所說的「亂戰流」——先把棋盤上的大模樣打個稀巴爛，再將對手的精心佈局揍得體無完膚，依一己主動把棋局撕開四分五裂逐一吞噬。不講究日本式的佈局美學，卻注重實戰勝利，南韓棋風橫掃橫壇，日本中國大陸俱難攖其鋒，曹薰鉉、李昌鎬、徐奉洙這些光聽名字也夠對手頭皮發麻。同一時間，中國文化大革命後的一代如聶衛平及馬曉春等逐一退陣，日本出現青黃不接的困難期，南韓棋手獨霸天下帷幕拉開。

　韓流興起 日本隱退os.tvboxnow.com2 N8 q& E/ n; {! Q
TVBNOW 含有熱門話題，最新最快電視，軟體，遊戲，電影，動漫及日常生活及興趣交流等資訊。$ \; R/ P: i9 C: g7 `3 w
南韓圍棋的興起，不能說與日本沒有關係，至低限度趙治勳出自木谷實門下。可是日本培養不出如南韓年長一代如曹薰鉉及趙治勳的棋手群，更說不上擁有像李昌鎬、劉昌赫以至李世石的新一代棋王族。這裏不涉及國族關係，純以圍棋愛好者角度而論，日本圍棋退下確是莫大損失。論圍棋人口日本一直佔先，日本棋壇更有「千萬人口」的說法，即是下圍棋或愛好者，不分專業與業餘，達千萬之眾。龐大巿場構建了巨大無比的空間，光是日本棋院便有數百專業棋手，以出版棋刊或下指導棋賺取日常收入，這才能夠專心致志在棋院打譜覆盤，再到七大頭銜爭取好成績，斬獲巨額獎金。TVBNOW 含有熱門話題，最新最快電視，軟體，遊戲，電影，動漫及日常生活及興趣交流等資訊。: B3 k; r& I, |; H
TVBNOW 含有熱門話題，最新最快電視，軟體，遊戲，電影，動漫及日常生活及興趣交流等資訊。8 V8 ^/ X" a' \& L+ `0 j
日本棋壇元老瀨越憲作《圍棋百年》第一卷，指出日本史書有載的第一參考譜是後漢年間，即約公元二百年的孫策對呂範，第二個參考譜才是日本棋手吉祥丸對日蓮上人，時維宋末，比孫策呂範之局晚了大約一千年。即使如此，日本棋風大盛後來居上，到了日本棋院創立，專業棋手可在棋院賺取收入，一般而言是初段月入十圓，二段二十圓，三四段各三十、四十圓。必須指出的是，當年日本大學畢業生也只月入三十圓；豐厚入息帶來厚密棋風，戰力蒸蒸日上。接下來最大的變化，是戰後五十年代經濟起飛帶來的動力。公仔箱論壇  x* `, r( F; y! m/ a" l! J- O" G
os.tvboxnow.com6 x( R, B. U8 ~# T% {" ?
　曾經大盛的扶桑圍棋$ _9 B  p: E) Z% y! {+ I% ~7 L

由於圍棋愛好者達一千萬，戰後日本百廢待興，傳媒尤其是報紙各自推出「新聞棋」，招攬棋手博弈，翌日在報章刊出棋譜，以增銷量。其中，《每日新聞》的本因坊頭銜，當時銷量第一《朝日新聞》的名人頭銜最為引人注目，幾乎是一紙因此風行。如今日本七大圍棋頭銜，依然不脫「新聞棋」傳統，《讀賣新聞》的棋聖獎金最高，四千五百萬日圓；十段是《產經新聞》主辦；碁聖是《靜岡新聞》等十二家報社合辦；王座是《日本經濟新聞》而天元則是《北海道新聞》等三家報社合作。
TVBNOW 含有熱門話題，最新最快電視，軟體，遊戲，電影，動漫及日常生活及興趣交流等資訊。- E# E6 H* Q) |5 ]
為了爭取讀者，報社各出奇謀，以通俗大報《讀賣新聞》為例，手上王牌是華裔棋聖吳清源，一段頗長時間，《讀賣新聞》專門報道吳清源與各對手的「十盤戰」，頗為哄動。

　巨額獎金帶動圍棋風尚，更能令棋手豐衣足食，參賽有參賽費，勝出則是驚天動地的大獎，由此蓄建的圍棋氛圍，成為異地棋手遠涉重洋到日本的其中一個原因。我們熟悉的吳清源以及六十年代冒出來的林海峰，之後的王立誠及王銘宛，俱是人們熟悉的華裔棋手。其中不乏美談，如林海峰等已在日本生活逾半世紀，領的仍是中華民國護照，一口國語從未走音變調。然而這只是水滴的一角，更巨大的作用是日本棋壇藉好手來投，互相砥礪出一波又一波的精英，孕育日本棋手的風格，早如三十年代吳清源與木谷實在信州閉關十個月創出「新布石法」；五六十年代先後出現高川格及坂田榮男，其中坂田榮男棋風銳利，人稱「剃刀」，把七大名銜全數包辦。之後是七十年代武宮正樹的宇宙流，不重邊而重中央，儼如一代宗師。os.tvboxnow.com: G  @: G3 d- Z

　日本棋運在九十年代開始快速下墮，這客觀上既有中國大陸及南韓棋手的上升，也有日本棋手從追求實戰勝利轉向尋求完美棋譜的層次出發，把黑白子的勝負置於度外。這是其中一個原因。另是日本人口老化，圍棋人口漸次減少，青少年不願把時光都磨磳在棋盤而放棄其他。這與中國大陸通過體校培養少年棋手，南韓以國策推動圍棋振興國譽有所不同；一方是轉為消閒及追求美感的心靈補足，另兩方則是舉國體制的傾注心力，最後出來的結果是日本棋手在國際賽顯得慵懨了一些，不如中韓高手的拳拳到肉。也許日本對今天種種感到太過熟悉，因為在五六十年代南韓仍在獨裁統治、中國大陸文革狂熱不能抽身，日本當時已然經歷今天中韓的勝境。曾經滄海難為水，今天的日本難以重塑昔日的自己。TVBNOW 含有熱門話題，最新最快電視，軟體，遊戲，電影，動漫及日常生活及興趣交流等資訊。# m4 u+ s* x) C& g4 H

　電腦愚魯 人心難測tvb now,tvbnow,bttvb% W$ c* s# X4 J3 p+ E& f+ l& W

說回李世石對AlphaGo之戰，興許這是一家之見的狹隘，我總覺得如果李世石對抗電腦時仍是一貫以來的李世石棋風，在CPU之前再次敗陣不足為奇。如前所說，李世石棋路早在電腦計算之中，然則當李世石不以自己所長棋路出手，會否也是電腦計算之內，這是一個大大的問號，也是對人工智能的挑戰——坐在對面的是另一個心智皆迥異的李世石，結果難料。人心最難測，六十年代，美國最大智囊蘭德公司（RAND）以電腦推算，最終計出美軍將會打勝越戰。這場浴血戰的結果已經寫在歷史牆上，是美國慘敗收場；在虛擬與現實之間，沒有必然，人生如棋，俱皆如此。os.tvboxnow.com2 \$ _5 J( |0 }! V

收藏分享評分

回復引用

訂閱 TOP

felicity2010

親王

Rank: 17

2^#

發表於 2016-3-13 10:01 AM | 只看該作者

【人機爭霸】AlphaGo 三連勝！　韓國棋王李世乭力戰逾4小時再落敗

棋王爭勝戰，李世乭再次不敵由 Google DeepMind 研發的人工智能 AlphaGo。 AlphaGo 連勝三局。, l; x. V0 g/ }* H* P- }
李世乭再戰 AlphaGo，整個圍棋比賽歷時 4 小時，惟最後仍然不敵 Alpha Go。AlphaGo 的勝仗意味人工智能已經勝出「五局三勝」的比試。李世乭正式認輸，人類已經0 : 3 落敗，但依照之前的協議，最後兩局依然會進行。os.tvboxnow.com) J" ^8 E, \; g0 ~7 E% K
. C7 `6 V0 K. J1 X

「他們如果想證明軟件是世界第一⋯⋯ 如果想當天下第一，得先過我這一關。」

較早前中國的圍棋王柯潔向傳媒表示，自己有六七成信心現在擊敗 AlphaGo；但在未來未必有同樣把握可以戰勝 AlphaGo，因為它可以不斷吸收經驗改善下棋策略。另外，南韓律師田石鎮認為這次比賽根本對李世乭不公平。因為 AlphaGo 可以隨時在網絡中收集資訊，又可分析李世乭落子後的各個策略，並非是意義上的「人工智能」。再加上，他認為 AlphaGo 有以名為 Brute Foce 演算法，即分析所有未來可行性的方法計算，也對對手不公平，為此 Google 應向李世乭以及其他圍棋棋手道歉。

Google 則強調， AlphaGo 並沒有用到 BF 演算法。而所謂「連上網絡」，其實是指 AlphaGo 會用到分佈式運算。 DeepMind 創辨人對此亦在 Twitter 回應：即使以分佈式運算，比起單機運算的勝率都只是大約 75%。他也再次強調，現時 AlphaGo 最重要的並不是其硬件，而是本身的「演算法」設計以及不斷的訓練。更重要是，不只是 AlphaGo，其實人類棋手也會在對弈時分析對方策略，所以指 AlphaGo 懂得拆局分析對對手不公的說法也不見成立。
os.tvboxnow.com( j2 @" M7 V: C: y% u
勝出圍棋比賽只是第一步。不久的將來，AlphaGo 的技術將不止會用於下圍棋，而會應用在智能手機系統、機械以及醫療系統中。DeepMind 在今年 2 月宣佈與英國國民保健署合作推出一個名為 Streams 的手機應用程式，令醫療人員可以更快地知道和病人有關的重要資訊，幫助決定診治病人的優先次序。

AlphaGo 贏下的比賽並不代表人類尊嚴受損；相反，這反映科學家在研發人工智能方面踏出重要一步。在未來若能善用這項技術，相信會對人類發展起重要作用。! ]% e6 m- [5 ]4 b, g
' e: _* n+ n8 N) e
TVBNOW 含有熱門話題，最新最快電視，軟體，遊戲，電影，動漫及日常生活及興趣交流等資訊。4 L* p8 q: O4 V

回復引用

TOP

felicity2010

親王

Rank: 17

3^#

發表於 2016-3-13 10:07 PM | 只看該作者

【人機爭霸】苦戰近5小時　李世乭反勝一局
os.tvboxnow.com" u8 h0 C5 h$ y) \$ E9 ~
棋王爭勝戰，韓國棋王李世乭首次擊敗 Google DeepMind 研發的人工智能 AlphaGo。李世乭與 AlphaGo 今日苦戰近 5 小時，最終因為 AlphaGo 犯下一個無法彌補的錯誤而獲勝。AlphaGo 開發商 DeepMind 創辦人 Demis Hassabis 在 twitter 祝賀李世乭，指李步步進迫，令 AlphaGo 犯錯。他指 AlphaGo 在第 79 手犯了錯，但要到第 87 手才認清這事實。  V# w% I) u0 D) K
昨日李世乭已經連輸 3 局，在一連 5 局的比試中正式落敗於 AlphaGo，今次人類首勝，起碼證明人工智能仍非毫無破碇。最後一場棋賽，將於周二（十五日）舉行。

今日李世乭在開局3小時後，已用盡他的兩小時時間，在最後一小時內只能用 60 秒思考便要下子，意味他今日下子比平時更加審慎。此時 AlphaGo 突然有數步不名所以的棋，連九段棋手、評述 Michael Redmond 亦無指無法理解。李世乭在第 78 手下了非常精秒的一著，令 AlphaGo 在第 79 手犯錯。Demis Hassabis 指，AlphaGo 在 79 手至 87 手還以為自己會有七成機會勝出，但 87 手後勝機突然暴跌，顯示它在 79 手犯的錯誤，要到 87 手才發現。儘管機會來臨，但李世乭仍能挺住壓力，平穩發揮，對 AlphaGo 步步進逼，把 Alphago 亦逼得時間用盡，進入每步 60 秒階段。其後 AlphaGo 似乎在努力扭轉局面，屢下奇手，但愈下愈怪，最後終於被逼投降。
os.tvboxnow.com! g9 c, C2 U% V: q6 ]1 ?  ]! h# w
香港圍棋協會評論指，李世乭似乎因整體勝負已定而放下包袱，有如猛虎出閘，好手連出，並以其強勁的計算能力，把 AlphaGo 逼入絕境。該會引述陳乃申六段指，李世乭可能找到了 AlphaGo 的缺點，而且 AlphaGo 在劣勢下似乎變得不會下棋，「可能這就是人和電腦的分別」。tvb now,tvbnow,bttvb1 l/ ~' ^. T3 d0 g6 T/ c& M3 Y

不過也有不少網民半開玩笑稱，AlphaGo 終於學懂放水，懂得不能贏李世乭太多，所以故意輸掉。TVBNOW 含有熱門話題，最新最快電視，軟體，遊戲，電影，動漫及日常生活及興趣交流等資訊。  _/ M- F! A6 w+ Y1 t+ Q
下一場比賽，亦即最後一場，將於周二（15日）舉行。TVBNOW 含有熱門話題，最新最快電視，軟體，遊戲，電影，動漫及日常生活及興趣交流等資訊。0 i8 G: V& n7 P0 I3 P8 Z
tvb now,tvbnow,bttvb7 F: z2 T" }+ _
昨天李世乭敗陣後指，儘管 AlphaGo 很強，但不是完美，也有其弱點。不過他坦言，儘管自己經驗豐富，但面對 AlphaGo，仍無法克服「從未面對過的巨大壓力」。這壓力正是影響他發揮的最大障礙。
tvb now,tvbnow,bttvb& M8 x% [( d5 w- s7 {
有輿論把今次李世乭落敗，稱為「人類輸給電腦」，但李世乭稱，「這次比賽只是我李世乭輸，而不是全人類」。
另外，外國遊戲新聞網站 Kotaku 報道，AlphaGo 的下一個挑戰遊戲，可能是經典戰略電腦遊戲 Starcraft。韓國在 Starcraft 界中素來強勁，韓國媒體 SBS (Seoul Broadcasting System) 就此事訪問了韓國引退 StarCraft 奇才 Lee "Flash" Young Ho，他認為自己能夠打敗 AlphaGo，看來下場激戰，將繼續是人工智能與韓國的對決。不過 Starcraft 除了考戰略外，更考手眼協調及極速鍵盤與滑鼠操作，AlphaGo 在這方面必然比人類優勝，似乎 Starcraft 對決對人並不公平。TVBNOW 含有熱門話題，最新最快電視，軟體，遊戲，電影，動漫及日常生活及興趣交流等資訊。/ l" o' |' }: I& ^0 p& x: Q" @
; _+ y7 j: V! n2 A$ O! b/ p' u- x! Z
Kotaku

回復引用

TOP

felicity2010

親王

Rank: 17

4^#

發表於 2016-3-14 06:55 AM | 只看該作者

首勝AlphaGo　李世乭發現電腦兩弱點　要求最後一局用黑子對弈: O7 ~( _2 [) E1 r. T+ X/ n: R

韓國棋王李世乭對 AlphaGo 這一場「人機之戰」，在對方連勝三場後，今仗終由李世乭獲勝。李世乭在賽後記者會上，未有驕傲，亦未見特別興奮。他說發現了AlphaGo有兩個弱點，其一是它擅於下白子，用黑子時猶疑時間較多，其二是當有意料之外的殺著，它的表現會變差，並較易犯錯。問到他將以何種態度面對最後一仗，他說今次用白子贏，「下次可唔可以用黑子？」因為用黑子贏更有價值。

李世乭在記者會上重申，之前未曾預料賽局會如此困難。他坦言自己確實對連輸三場感到震驚，但是他從未因此打算放棄，因為每一局他都下得相當享受。有記者請他談談這一局當中，獲許多人形容為「神之一著」的決定性一著，即第 78 手，李世乭說那是他當時看到唯一可以下的地方。

「這場勝仗是如此珍貴，給我世界任何東西我也不換。」李世乭（Korea Herald）os.tvboxnow.com) l5 ]5 O E, M% X( ~/ I

亦有記者提到說，AlphaGo 熟知李世乭下棋的方法，而李世乭卻不認識 AlphaGo，似乎兩者在所得資訊上並不公平。AlphaGo 開發商 DeepMind 創辦人 Demis Hassabis 表示，AlphaGo 並未特別接受針對李世乭的訓練，而是獨立以不停下棋的方式受訓，所以沒有資訊不公平。

問到李世乭將以怎樣的心情面對最後一局？他說自己這次以白子勝，所以希望能再以黑子多勝一局。他更直接向 Demis Hassabis 請求，下局可否讓他取黑子，獲 Hassabis 即場答允。李世乭的勇氣得到在場人士鼓掌致敬。

回復引用

TOP

felicity2010

親王

Rank: 17

5^#

發表於 2016-3-14 06:59 AM | 只看該作者

淺說 AlphaGo
, G" _9 D( H7 _- O7 O- F
TVBNOW 含有熱門話題，最新最快電視，軟體，遊戲，電影，動漫及日常生活及興趣交流等資訊。4 b! y5 L& n7 S$ M3 S

os.tvboxnow.com2 {6 L0 m$ m# J
（編刊：原文寫於3月12日，獲作者授權轉載）tvb now,tvbnow,bttvb; X2 D( k) y0 y+ L8 O( g
【文：桑紋錦】
os.tvboxnow.com; [; W0 c r& @) _/ M# {( y
首先，今日是李世石先生結婚十週年紀念日。多麼值得紀念的一天，先祝李先生李太太錫婚紀念日愉快，長長久久！李先生今日堅強戰鬥，雖然不敵電腦的蠻力，但是回到家還有太太溫暖的擁抱，還有女兒繞膝，還有無數我這樣遠遠關注比賽，為他搖旗吶喊，加油打氣的人，做人還是很美好的。李先生加油。8 [, `1 d6 m8 o" o, `

再說一件題外事。其實我不會下圍棋，平時也並不關心圍棋界的消息。這次比賽是從德國最大的科普新聞網站heise那裡看到的。當天去查了一下有關AlphaGo的資料，了解到她那套算法是用到經過海量棋譜深度學習以後的模擬神經網絡。而我是了解機器深度學習的原理，也見識過這一族算法的厲害的。在計算機視覺，計算機語音識別等等領域，這幾年都是大量用到這套工具。雖然是圍棋盲，但是當下就隱隱感覺到了AlphaGo來者不善。

我就在heise網站留言說：“AlphaGo的深度學習算法有學到人類最優秀棋手的think patterns，在實戰中還有強勁的實時運算能力找到致勝的道路。歸根到底其實李也是這樣子學習棋藝並且作戰的。但是，實戰中計算機不會累也不會漏看什麼局面，它的表現要比人類穩定得多。如果李在比賽中從頭到尾都處於極佳狀態，那他還有點機會。否則他會很難辦。我衷心祝李好運。”
就是這樣一個留言，有被德國的圍棋愛好者痛罵，說李一定會贏。基本上，heise的讀者已經是些技術宅人。也就是說，heise的讀者對新技術的理解和接受水平是高於德國民眾的平均水平的。由此可以窺得德國社會對於人工智能怎樣運作的理解度和接受度。所以人工智能很容易在德國社會引起無謂的恐慌和抵觸。所以自動駕駛汽車一類的先進工具注定會在德國遭遇阻力。所以科普工作者們必須還要做很多事。好的我今天就是來科普的。廢話講完，言歸正傳。4 Y/ R5 u8 W+ K' U& A

首先，簡單說下為什麼下好圍棋對計算機來說非常困難。通常，寫棋類對弈的程序，naive一點的算法，就是把每一步以及以後的所有可能出現的情況全部列出，在電腦的內存中建立一種所謂“搜索樹”的數據結構。搜索樹上的每一個分支，就代表一種走法的sequence，這個分支展開直到末端，就是對弈到底的情況，就可以看出勝負。某一個還沒有走到底的盤面，就對應於搜索樹上末端之前的某個節點。在這個節點上，可以根據它後面展開分支上的勝負情況，給出一個勝負概率。2 o' R) }7 ?7 o; w7 N7 U
os.tvboxnow.com( `8 z7 l3 k2 \/ e
比如，第100步上的某個節點，後面還有100個分支。這100個分支中，20個到最後是贏，80個是輸。那麼這個第100步節點上的勝率就是0.2。不是一個理想的選擇，程序應該看看第100步中另外的節點的勝率。後續步數越多，就代表搜索樹越“深”。假如圍棋在理論上是361步走完，那麼一開始的時候，它的搜索樹的深度是361。走到第300步的時候，因為前面的sequence已經完全確定，剩下的搜索深度就只有61層了。
公仔箱論壇0 m+ U ?3 K- H& g+ @2 P0 }5 q
那麼，這種搜索樹，假如全部分支都展開，可以有多大呢？據信息學家Claude Elwood Shannon計算，國際象棋每一步平均有20種不同的走法。也就是說，它的搜索樹的根部會有20個分支，第二步的每一個分支上，又有20個分支，依次類推。走三步就有多少個分支了呢？20*20*20=8000。走三十步就是2030個分支。而圍棋棋盤比國際象棋更大。假如要把所有對弈結果窮盡列舉，那麼它的搜索樹上會有多少個分支呢？科學家的計算結果，大約是10170個。而我們可以觀測到的宇宙中的所有原子，加起來也不過是1080個。每一個原子都用來代表圍棋下法的一個分支都不夠用。就算開動全世界所有大大小小的電腦一起搜索每一種走子結果，搜到地老天荒宇宙第二次大爆發都只剛剛搜了個開始。圍棋編程夠難吧？怎麼辦呢？
* ~2 ]( A. W' c' N% [+ H6 u
有些白痴走法，比如，第一步A1，第二步A2，第三步A3……是不可能去走的。於是，那些白痴程度類似A1-->A2-->A3的分支，全部可以砍掉。假如剩下的分支還是太多，那就只能隨機抽取一些分支搜到底，再來算一算某個節點上的獲勝概率了。這種隨機抽樣再計算的方法就是所謂的蒙特卡洛法。這種算法可以在有限的時間內保證給出一種解答，但不保證是最優解。國際象棋規則相對多，盤面上明顯的優劣比較好判斷，按著下棋規則和盤面優劣情況可以砍掉它的搜索樹中絕大部分的分支。接下來的隨機抽分支，樣本覆蓋面比較大，最後算出來的那幾個“下一步”的獲勝概率就比較準確。所以光靠這個蒙特卡洛搜索法，再配合一些局部優化算法，若干年前就已經戰勝人類。但是圍棋不同。她的搜索樹上的分支比國際象棋多出許多。然後，用來“砍樹”的，直接一些的規則很少。“用簡單規則把搜索分支減少到可控範圍”這條路在圍棋上是走不通的。& W: w0 L4 L$ a! E6 e1 {
, ~7 m3 ]; t/ T# s
於是我們必須教給計算機程序一些“棋理”，讓她能在盤面上作出好的選擇。而圍棋的棋理十分玄奧，而且，有時同一個盤面同一個佈局，好壞也是眾說紛紜。現在的問題是，怎樣讓計算機來學習這些玄虛奧妙，說也說不清楚的棋理呢？- B4 d; V: ?! z) A+ ]* j1 ]4 {

這裡，就可以用到模擬神經網絡和深度學習算法來讓計算機自動分析歸納出棋理來了。

所謂的“模擬神經網絡”也是一種數據結構。數據結構中的節點好比神經元，常常用來classify一些事情。連接節點之間的通道則常常代表某種觸發或者傳輸條件。下面我們來看一個最最簡單的，層數為2的模擬神經網絡：

公仔箱論壇  W: g3 a: d. X0 g
上面這個兩層的神經網絡表達了一個布爾函數“異或XOR”。這個神經網絡，在第一層（玫紅色的那一層）上的節點裡輸入兩個布爾數X1和X2的值，通過布爾運算規則得出中間值Z1和Z2（藍色部分），這兩個中間值再與一下，得到函數的輸出結果y。這個例子只是給大家提供一個關於類神經網絡的感性認識。tvb now,tvbnow,bttvb; v; m! q5 Q  c
os.tvboxnow.com& P4 l! G% b+ f
因為我自己對圍棋一無所知，所以用計算機圖像識別作例子來簡單說明一下這種數據結構的應用。一張人臉照片上有許多特徵，比如嘴角，眼角，鼻翼等處有凹陷，照片上相應的這些點顏色就比較深。我們可以想像一下神經網絡的某一層就是用來儲存照片上這些深色的點的信息。然後，還可以找出這些點和點之間的約束條件，比如兩個深色點之間的直線距離，比如相對於頭寬的距離，諸如此類，就可以進一步確定“這是一隻眼睛”，“這是一張嘴”等等中間值。這就是所謂“模式識別”，即pattern recognition。公仔箱論壇# _8 P9 G" ~, p* F% D2 R% Z$ Z
) `' g9 ^7 c- m0 x9 ?. Q
通常神經網絡中的每一層負責偵測圖上的一方面或者某些方面的特徵信息。最後綜合網絡中各層特徵信息，再經過一層或者幾層的線性回歸模型，計算機得出這張照片是不是一張人臉的結論。而這些“人臉的各個方面的特徵”，在訓練的時候則不必由人事先告訴計算機。只需給計算機一張照片並告訴它這是一張人臉，就可以。只要用來訓練的照片足夠多，算法就可以很好地歸納出所有這些特徵或者模式。

而計算機“歸納特徵”或者“歸納模式”的能力是驚人的。2012年的ImageNet計算機圖像識別競賽上，冠軍SuperVision小組訓練出來的神經網絡有8層，用到6000萬個參數（可以看成是6000萬個特徵）。那個神經網絡識別貓貓狗狗比我厲害多了。有些罕見貓狗，長得比較像對方，憑照片我無法判斷是貓還是狗，而算法的判斷則八九不離十。TVBNOW 含有熱門話題，最新最快電視，軟體，遊戲，電影，動漫及日常生活及興趣交流等資訊。" l! ?/ R, K  ]8 z6 K& ^
TVBNOW 含有熱門話題，最新最快電視，軟體，遊戲，電影，動漫及日常生活及興趣交流等資訊。$ l( ^5 k5 o1 x2 s4 ~% U% C& Q
至於說那6000萬個特徵，到底是些什麼呢？那些寫算法的科學家自己事先都不知道的，必須到那個神經網絡裡去查詢一下的。查詢出來的結果，很多都是連那個科學家自己都覺得匪夷所思。比如（例子我亂舉的，只是給大家一個印象），“耳朵頂部到耳朵底部的連線跟頭部弧線的某個切線的夾角的數值範圍”。一般人類不會去這樣看一張圖。$ b* @" o( P; D5 T7 w2 Y
os.tvboxnow.com4 W; b0 @2 k! H/ n2 Y& g7 p& Z
大家必須記住的是，海量照片訓練出來的神經網絡，並不是記住某張照片上是什麼，而是把照片上的特徵全部都分析歸納過。所以，你給它一張新的照片讓它判斷，它首先是分析這張照片的特徵，再根據特徵來判斷，而不是“背”照片。基本上這個神經網絡就是一個知識儲存庫。
所謂的“深度學習”，“深度”是指算法底下那個神經網絡的深度。這個網絡越深，被研究對象的特徵也就被分析得越透徹。比如Google的語音識別神經網絡，就深達30層，不得了的事。模擬神經網絡技術已經有50多年曆史，但是以前不被重視。這是因為，如果訓練用的數據太少的話，它給出的結果很不准確。但是，大數據時代的到來令這一族算法獲得了新生和極為廣泛的應用。
現在大家可以想像一下怎樣用深度學習算法來訓練AlphaGo.餵給它棋譜，並且告知最後勝負就可以。當中的棋理，就跟圖形識別中的特徵歸納類似，算法自己會去歸納總結的。這就它厲害的地方。
  r+ B. m; x3 N; t* V
第一，他並不需要一個頂尖高手給他作教練。當然那個學習模塊內部還是需要一些用來歸納規律的數學模型。他的建模專家，只要是個中等程度的棋手，給那個學習算法適當程度的約束就可以。太白痴或者太高手都不適合。對圍棋一無所知的建模人員會讓那個深度學習模塊無所適從。而太高超的棋手，可能會把太多自己的想法加到那個選擇模型中去，而他的判斷未必是最優的。tvb now,tvbnow,bttvb# h. ]+ H3 Z2 v. B* k4 N" Z; s; S
黃士傑這樣的棋手，給深度學習模塊作一些指導性的約束，不太少也不太多，其實很合適。( J: {* W* _: p& ~
+ q& ^: w# x9 k
第二，經過海量的棋局對弈訓練，一些玄妙高深而難以言傳的所謂“棋理”，會被AlphaGo的深度學習模塊整理歸納出來的。這中間，有些是我們人類已經知道的，而有些可能是人類並不知道，並沒有探索過的“致勝棋理”，或者說“致勝圍棋哲學”。圍棋對弈中，雙方的發揮空間那麼大，發生這樣的事（電腦歸納出人類未知的圍棋哲學）其實很正常。換句話說，AlphaGo經過幾千萬局的對弈，對圍棋棋理的“理解”程度，很可能已經超過了人類。以上兩點，也正是我在德國heise那樣留言的理由。公仔箱論壇6 h1 L! j2 h, N' C3 P+ n  ?* W

機器學習算法訓練出來的結果，即不同盤面下的策略選擇和價值判斷，是分別儲存在AlphaGo的策略網絡和價值網絡中，代表AlphaGo的“棋感”。這種類神經網絡的數據結構有一個特點，就是讀取效率非常高。它們用來給AlphaGo提供基於經驗知識的“直覺判斷”，也就是為下一步提出幾個最有價值的選點。這裡的“價值”以獲勝概率表示。
os.tvboxnow.com5 q/ }* S: s6 T' Z; g% [
但是，那個獲勝概率也只是一個估計值。跟水平一般的棋手下，那兩個網絡就足夠。相當於，高手對庸手，高手憑感覺下棋就可以了。但是遇到高手時，那些“感覺”就要到上面所說的那個搜索樹中老老實實層層展開去驗算一下。但是這時，因為選點極少，搜索樹的寬度已經大大減小，隨機抽取一些分支搜到底，算出來的結果準確率也相應提高了。4 o6 Q* \2 O/ @2 ?
os.tvboxnow.com$ h0 ?# O9 }( v" u5 E2 U  ~
很好理解的是，棋子越下到後面，搜索樹的深度越小，在給定的時間下，可以抽取驗算的分支就更多，各個選點上的勝負率就算得越準確。而在前半局時，搜索樹的分支還太多，也太深，AlphaGo也算不准確。對手足夠精明老練且運氣好的話，可能可以占到很大的優勢。越往後AlphaGo算得越準確，所以，人在佔優的情況下還絕對不能出錯。這對人來說太難了。而如果前半局就處於不利，後半局基本沒有機會翻盤，就抱著學習的心態下到底吧。

基本上，看那個算法框架就知道，圍棋已經被人工智能crack了。這次的人機對弈，其實是對這套算法的一次檢驗。就算現在輸掉，假以時日，AlphaGo勝過人類棋手是必然的事。完全不必悲觀或者害怕。它不過是人類製造出來的工具，知道它的運作機理就可以駕馭它。網上流傳很廣一個說法我覺得很好：汽車也是人發明的，人也不必跟汽車去比誰跑得快呀！所以我一直一直鼓勵大家多少去了解一點機器學習的算法。了解了就知，機器算得比我們準比我們快是理所當然的事，輸掉也根本不是什麼恥辱。沒有我們發明那些算法，告訴機器怎樣去瘋狂地算瘋狂地歸納，它們什麼也不懂呀！
公仔箱論壇+ c) Q! o4 M6 j% _& e+ B4 k- ]9 \: o
AlphaGo的這套算法，雖然都不是特別新，但是正如知乎網上的一位科學家所說的，它的價值在於它的工程實現。這個富有邏輯和創意的算法組合給其他類似的“困難”問題提供了一個光輝樣本。當中許多問題細節在算法工程上的處理方法，會給其他問題的算法帶來啟迪。8 }& j8 r( B/ F4 O4 ]
最後，我要說的是，人工智能再發展，人仍然有作為人的獨特價值。人的邏輯思維，機器可以模仿歸納。但是，人對某物某人某件事一瞬間的情生意動，或者天長地久的一往情深，機器無法模擬得到。讓我們在有生之年好好感受。
( X, J7 J! f0 ?" J' [$ S! @" c2 `
謝謝閱讀，下次再見。- |7 |- Z) \$ M  y# R
作者博客

回復引用

TOP

返回列表