返回列表 回復 發帖

[其它] 以一敵五 AI贏話事啤高手


9 i5 o% n, n7 {4 |TVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。Pluribus在德州話事啤六人牌局中,贏五名人類高手的示範畫面。; H2 j0 Z* A# R! F- `. C

$ x0 |5 u4 q: f& V3 s, TTVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。繼一對一棋局後,人工智能(AI)發展再達里程碑,社交網facebook與大學合研的人工智能「合眾」(Pluribus),以「超人」表現多次在六人牌局戰勝世界高手,是人工智能首次在多人牌局中擊敗人類,開發者預言可能改寫職業牌局玩法。TVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。1 f8 f5 ]1 A  \% p; ]5 }

! H# W* K! f0 v% E. H( P  L「合眾」是美國卡內基梅隆大學電腦系教授桑德霍爾姆(Tuomas Sandholm)及fb人工智能倡議組成員布朗(Noam Brown)的心血,前日於美國《科學》期刊詳述研究成果,稱「合眾」在一場六人德州話事啤賭局,大勝五名職業高手。
8 r8 o  ~/ z# b8 d) ^; l3 eos.tvboxnow.comTVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。/ x; l4 z1 O4 C3 U
表現超人水平 再達里程碑
5 s4 j2 e8 t/ T  M2 Bos.tvboxnow.com根據布朗解說,「合眾」先花20小時「強化學習」,系統自行作以萬億次計的對戰練習,慢慢理解專業撲克玩法;系統強化後,先與兩大冠軍級人馬伊萊亞斯(Darren Elias)及弗格森(Chris Ferguson)交手作實戰訓練,兩人各玩5,000手後敗下陣來;第二回再與13名職業牌手對戰,「合眾」每局以一敵五,在合共10,000手的牌局中,系統平均每小時贏1,000美元(7,800港元)。
0 _" }" W# x+ v& itvb now,tvbnow,bttvbos.tvboxnow.com; Q! @) c$ k% O7 r$ t( m6 B
人工智能研究10多年來一直未能攻破多人撲克牌局,一是因為牌局涉及多名對手「冚牌」的未知數,以及要運用「唬人」等人性技巧;「合眾」在實驗中以數學演算解決了這兩大挑戰,「系統不會視唬人為騙人或不誠實,只是為贏錢最多的一種手法」。布朗又提到系統多次作「驢式下注」(donkey bet),即是比開注選手提早下注,次數比其他職業選手更多,一般認為是新丁才會這樣做,結果「合眾」大勝,勢打破職業牌局既定規則。
  M; X3 c" ]8 R1 kos.tvboxnow.com
& h" w, Z* X# G; n( Qos.tvboxnow.com桑德霍爾姆在聲明中說:「合眾在多人牌局中表現達『超人』水平,是人工智能和博奕理論的重要里程碑。」「合眾」另一好處是成本低,其雲端電腦系統只花了150美元(1,173港元)建立,相對於數以百萬美元和5,000專家開發的Google人工智能系統DeepMind,大大減低科研成本。布朗強調「合眾」實驗只為同行參考,他和facebook都不打算將之應用於真實牌局中,亦未詳細透露編碼,以免損害撲克界;研究會集中修正系統基礎,有望用以解決實際生活問題,如網上保安、詐騙偵察及無人駕駛導航等。
# z+ H0 \) a. y2 l公仔箱論壇法新社/英國廣播公司
隨機出招難捉路「師父」佩服os.tvboxnow.com1 S- O" G9 ^+ G8 ?. i

! ?; h: B; j/ Z* ?  c) rTVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。被擊敗的人類高手,包括贏得最多世界撲克巡迴賽冠軍的伊萊亞斯。
0 d8 ?1 W: ?2 P% `0 cTVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。9 s- o( f8 I1 P' ?/ f
「合眾」在短時間強化自己,能擊敗多名話事啤高手,背後兩名「師父」亦深感佩服。世界撲克巡迴賽四屆盟主伊萊亞斯(Darren Elias)是首回合對戰的兩名高手之一,他一人對戰五組「合眾」系統,「我每天跟電腦玩牌,一天玩上逾千手」,系統出錯時通知研究員。
. ^4 p( K8 I' ^, ~6 B7 s5 \
; A; J4 Q$ c; j& u1 zTVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。伊萊亞斯說,系統在數天至數周內由三流牌手成為世界級高手,而且施展虛招時被人類更進取,進步快得可怕:「系統最大優勢是能混合運用策略,人類選手亦一樣,分別在於電腦系統可以完美地隨機施展策略,並維持一定水平,這是大部份人做不到的。」伊萊亞斯又說,系統就算面對同一種牌局,亦會有不同應付方法,故對手很難捉路。另一位有份參與的六屆世界撲克大賽冠軍弗格森亦同意:「合眾是難應付的對手,無論手上拿甚麼牌,都很難猜到它的下一步。」
1

評分次數

  • aa00

返回列表