國際象棋、圍棋、撲克無所不能
新AI玩策略類游戲有超人表現(xiàn)
【總編輯圈點】
科技日報北京11月19日電 (記者劉霞)谷歌“深度思維”公司開發(fā)出一款名為“游戲?qū)W生”(SoG)的新人工智能(AI)工具,能在國際象棋、圍棋、撲克和其他需要多種策略才能獲勝的游戲中擊敗人類玩家?!吧疃人季S”公司表示,最新研究朝著能以超人的表現(xiàn)執(zhí)行多項任務(wù)的通用AI邁出了重要一步。相關(guān)論文發(fā)表于最新一期《科學(xué)進(jìn)展》雜志。
SoG模型源于兩個項目:一是首個在撲克中擊敗人類職業(yè)玩家的AI程序DeepStack,其由加拿大阿爾伯塔大學(xué)研究團(tuán)隊創(chuàng)建;另一個是“深度思維”公司創(chuàng)建的AlphaZero,其在國際象棋和圍棋等游戲中擊敗了最優(yōu)秀的人類玩家。
這兩個模型之間的區(qū)別在于:一個模型關(guān)注的是不完美的知識游戲,也就是玩家不知道所有其他玩家的狀態(tài),比如撲克游戲中其他玩家的牌;而另一個模型則關(guān)注的是國際象棋這樣的完美知識游戲,玩家可隨時看到所有棋子的位置。這兩種游戲所需要的策略大相徑庭?!吧疃人季S”雇傭了DeepStack團(tuán)隊,建立了一個通用模型,SoG應(yīng)運而生。
研究人員在國際象棋、圍棋、得州撲克和一種名為“蘇格蘭場”的桌游上測試了SoG,發(fā)現(xiàn)它可擊敗幾款現(xiàn)有的AI模型和最優(yōu)秀的人類玩家。研究人員表示,SoG應(yīng)該也能學(xué)會玩其他游戲。SoG會先開始學(xué)習(xí)如何玩游戲,然后通過實踐改進(jìn)并教會自己如何與另一個版本的自己比賽,在此過程中學(xué)習(xí)新策略,增強自己的能力,使其更具通用性。
上世紀(jì)90年代,計算機“深藍(lán)”戰(zhàn)勝人類國際象棋大師時,曾引起很大轟動。前幾年,谷歌旗下的AlphaGo機器人戰(zhàn)勝人類圍棋選手,也廣受關(guān)注。如今,人工智能程序已“進(jìn)化”到可以在多種游戲中擊敗人類。但是,看到這樣的新聞,反而不再那么震驚了。原因在于,我們已逐漸認(rèn)識到,對于有邏輯、有規(guī)則、可計算的事物,人工智能的確有其過人之處。與此同時,人類也有許多特征,如道德、情感、關(guān)懷、創(chuàng)意等,是人工智能仍遠(yuǎn)遠(yuǎn)無法企及的。
版權(quán)聲明:凡注明“來源:中國西藏網(wǎng)”或“中國西藏網(wǎng)文”的所有作品,版權(quán)歸高原(北京)文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用,須注明來源中國西藏網(wǎng)和署著作者名,否則將追究相關(guān)法律責(zé)任。