返回列表 回復 發帖

[其它] 以一敵五 AI贏話事啤高手

TVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。* X# m# G. d" ~/ f1 @$ w8 D3 u7 d3 m7 Z
Pluribus在德州話事啤六人牌局中,贏五名人類高手的示範畫面。
1 C, A0 V( [) hos.tvboxnow.com
; s) C7 b0 ^  T/ F  H# L繼一對一棋局後,人工智能(AI)發展再達里程碑,社交網facebook與大學合研的人工智能「合眾」(Pluribus),以「超人」表現多次在六人牌局戰勝世界高手,是人工智能首次在多人牌局中擊敗人類,開發者預言可能改寫職業牌局玩法。tvb now,tvbnow,bttvb  \6 p. d( G* ~; P2 _* }% V! X

* _' [5 u* }3 Fos.tvboxnow.com「合眾」是美國卡內基梅隆大學電腦系教授桑德霍爾姆(Tuomas Sandholm)及fb人工智能倡議組成員布朗(Noam Brown)的心血,前日於美國《科學》期刊詳述研究成果,稱「合眾」在一場六人德州話事啤賭局,大勝五名職業高手。
, n8 i8 u: o) u1 `1 r1 c9 kTVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。TVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。* Q7 S1 p) Y/ ~+ A, g3 A0 n/ V
表現超人水平 再達里程碑
5 z& A, u8 x! M0 g- P- h9 r- JTVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。根據布朗解說,「合眾」先花20小時「強化學習」,系統自行作以萬億次計的對戰練習,慢慢理解專業撲克玩法;系統強化後,先與兩大冠軍級人馬伊萊亞斯(Darren Elias)及弗格森(Chris Ferguson)交手作實戰訓練,兩人各玩5,000手後敗下陣來;第二回再與13名職業牌手對戰,「合眾」每局以一敵五,在合共10,000手的牌局中,系統平均每小時贏1,000美元(7,800港元)。
0 j( o( T. |! g6 u- `2 m  [2 m公仔箱論壇os.tvboxnow.com% C: K$ \. E- `* W& E3 b6 }
人工智能研究10多年來一直未能攻破多人撲克牌局,一是因為牌局涉及多名對手「冚牌」的未知數,以及要運用「唬人」等人性技巧;「合眾」在實驗中以數學演算解決了這兩大挑戰,「系統不會視唬人為騙人或不誠實,只是為贏錢最多的一種手法」。布朗又提到系統多次作「驢式下注」(donkey bet),即是比開注選手提早下注,次數比其他職業選手更多,一般認為是新丁才會這樣做,結果「合眾」大勝,勢打破職業牌局既定規則。TVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。) Q/ f4 k* Z3 F
! s8 W8 R$ ]$ H( u  d2 A6 \3 ]/ G1 m; U
桑德霍爾姆在聲明中說:「合眾在多人牌局中表現達『超人』水平,是人工智能和博奕理論的重要里程碑。」「合眾」另一好處是成本低,其雲端電腦系統只花了150美元(1,173港元)建立,相對於數以百萬美元和5,000專家開發的Google人工智能系統DeepMind,大大減低科研成本。布朗強調「合眾」實驗只為同行參考,他和facebook都不打算將之應用於真實牌局中,亦未詳細透露編碼,以免損害撲克界;研究會集中修正系統基礎,有望用以解決實際生活問題,如網上保安、詐騙偵察及無人駕駛導航等。
2 y" q! d" [" n8 ~4 S" O7 i; `8 o7 N* BTVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。法新社/英國廣播公司
隨機出招難捉路「師父」佩服
! y: y( K" E0 ]. \+ I; N1 C2 Xos.tvboxnow.comtvb now,tvbnow,bttvb' r: w( @1 E" x( ?1 W$ |2 k
被擊敗的人類高手,包括贏得最多世界撲克巡迴賽冠軍的伊萊亞斯。
$ X1 c8 R+ [% Z! @tvb now,tvbnow,bttvbos.tvboxnow.com" U( M& q3 ^' m- Y
「合眾」在短時間強化自己,能擊敗多名話事啤高手,背後兩名「師父」亦深感佩服。世界撲克巡迴賽四屆盟主伊萊亞斯(Darren Elias)是首回合對戰的兩名高手之一,他一人對戰五組「合眾」系統,「我每天跟電腦玩牌,一天玩上逾千手」,系統出錯時通知研究員。公仔箱論壇# ]3 w; t, v: c6 j1 K
TVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。; a  M, O# H% J7 m) W: Z
伊萊亞斯說,系統在數天至數周內由三流牌手成為世界級高手,而且施展虛招時被人類更進取,進步快得可怕:「系統最大優勢是能混合運用策略,人類選手亦一樣,分別在於電腦系統可以完美地隨機施展策略,並維持一定水平,這是大部份人做不到的。」伊萊亞斯又說,系統就算面對同一種牌局,亦會有不同應付方法,故對手很難捉路。另一位有份參與的六屆世界撲克大賽冠軍弗格森亦同意:「合眾是難應付的對手,無論手上拿甚麼牌,都很難猜到它的下一步。」
1

評分次數

  • aa00

返回列表