現(xiàn)在回想起來,這一天似乎比小說里來得還要早。 今天早上,Deep MInd 創(chuàng)始人 宣布了谷歌在人工智能領(lǐng)域的重要進(jìn)展:它開發(fā)出了一種可以在圍棋中擊敗職業(yè)棋手的程序——后者可以通過機器學(xué)習(xí)的方式掌握棋局。
今年3月,他將在韓國首爾與韓國圍棋選手李世石進(jìn)行九段比賽。 李世石是近10年來獲得世界第一冠軍次數(shù)最多的選手。 谷歌為此提供了100萬美元的獎金。 李世石表示,他對這場對決充滿期待,并有信心獲勝。
最近官方微博上也寫到了這件事,其中有這樣一句話:“然而,對于我們來說,最大的成就不是一個手動輸入規(guī)則的(-)‘專家系統(tǒng)’,而是機器學(xué)習(xí)弄清楚了如何贏得圍棋。”我自己。”
以下轉(zhuǎn)載自新浪科技。 原標(biāo)題是《谷歌機器學(xué)習(xí)取得重大突破,圍棋程序?qū)⒋髴?zhàn)李世石》。
1月28日上午消息,谷歌今日召開全球電話會議。 Deep MInd 創(chuàng)始人 宣布了谷歌在人工智能領(lǐng)域的重要進(jìn)展:開發(fā)出能夠在圍棋中擊敗職業(yè)棋手的計算機。 程序——可以通過機器學(xué)習(xí)掌握游戲技能。
計算機和人類之間的競爭在國際象棋游戲中并不罕見。 計算機已經(jīng)在跳棋、跳棋、國際象棋等游戲中成功挑戰(zhàn)人類。 但對于已有2500多年歷史的圍棋來說,計算機此前從未戰(zhàn)勝過人類。 圍棋似乎有一個簡單的棋盤,但并不困難的規(guī)則。 棋盤每邊有19條等距垂直相交的平行線,總共形成19×19(361)個交點。 兩名玩家交替移動,以盡可能占據(jù)棋盤上的空間。
在游戲極簡的表??面之下,圍棋有著令人難以置信的深度和微妙。 當(dāng)棋盤為空時,第一個玩家有 361 個選項。 在比賽過程中,它的選擇遠(yuǎn)比國際象棋多,這就是為什么人工智能和機器學(xué)習(xí)的開發(fā)者總是希望在這里取得突破。
從機器學(xué)習(xí)的角度來看,圍棋計算的最大數(shù)量為3361,近似體積為1080,而觀測到的宇宙中的原子數(shù)量只有1080個。國際象棋棋局的最大數(shù)量為2155,被稱為香農(nóng)數(shù)量,大約為 1047。
傳統(tǒng)的人工智能方法是將所有可能的走法構(gòu)造成一棵搜索樹,但這種方法并不適合圍棋。 谷歌此次推出的產(chǎn)品將先進(jìn)的搜索樹與深度神經(jīng)網(wǎng)絡(luò)相結(jié)合。 這些神經(jīng)網(wǎng)絡(luò)通過包含數(shù)百萬個類神經(jīng)連接的 12 個處理層傳遞棋盤的描述。
其中一個神經(jīng)網(wǎng)絡(luò),“決策網(wǎng)絡(luò)”( )谷歌人工智能李世石,負(fù)責(zé)選擇下一步行動,另一個神經(jīng)網(wǎng)絡(luò),“價值網(wǎng)絡(luò)”(“ ”),預(yù)測游戲的獲勝者。谷歌用以下方法訓(xùn)練神經(jīng)網(wǎng)絡(luò)人類圍棋大師下了 3000 萬盤棋,同時該網(wǎng)絡(luò)還自行研究了新策略,在其神經(jīng)網(wǎng)絡(luò)之間運行了數(shù)千盤圍棋,通過反復(fù)試驗來調(diào)整連接點,這一過程也稱為鞏固學(xué)習(xí)這是通過大量利用云平臺完成的大量研究工作。
(所使用的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖)
征服Go對于來說意義重大。 它不僅僅是一個遵循人工規(guī)則的“專家”系統(tǒng),它還可以通過“機器學(xué)習(xí)”自行學(xué)習(xí)如何贏得圍棋比賽。 谷歌希望利用這些技術(shù)來解決世界上最棘手、最緊迫的問題——從氣候建模到復(fù)雜的災(zāi)害分析。
在具體的機器訓(xùn)練方面,將決策網(wǎng)絡(luò)輸入到人類圍棋專家的對弈中,直到系統(tǒng)能夠預(yù)測57%的人類動作。 之前的最好成績是44%。 之后,通過在神經(jīng)網(wǎng)絡(luò)內(nèi)玩游戲(可以簡單理解為和自己下棋),我開始學(xué)習(xí)獨立探索新的圍棋策略。 當(dāng)前的決策網(wǎng)絡(luò)可以通過巨大的搜索樹擊敗大多數(shù)最先進(jìn)的圍棋程序。
價值網(wǎng)絡(luò)也是通過與自己下棋來訓(xùn)練的。 當(dāng)前的價值網(wǎng)絡(luò)可以評估每一步棋獲勝的可能性有多大。 此前這被認(rèn)為是不可能的。
事實上,它已經(jīng)成為目前最好的人工智能圍棋程序。 在與其他程序的比賽中,他單機獲勝500局,甚至有過四步擊敗對手的記錄。 去年10月5日至10月9日,谷歌安排了與歐洲圍棋冠軍樊麾(樊麾:法國國家圍棋隊主教練)的一場閉門比賽,谷歌以5-0獲勝。
(與歐洲圍棋冠軍樊麾五場比賽)
公開比賽將于今年三月舉行。 這場比賽將在韓國首爾與韓國圍棋選手李世石進(jìn)行九段對決。 李世石是近10年來獲得世界第一冠軍次數(shù)最多的選手。 谷歌提供了100萬美元作為獎金。 。 李世石表示,他對這場對決充滿期待,并有信心獲勝。
值得一提的是,上一次著名的人機游戲要追溯到1997年,當(dāng)時IBM開發(fā)的超級計算機“深藍(lán)”擊敗了國際象棋冠軍卡斯帕羅夫。 然而,國際象棋的算法比圍棋簡單得多。 在國際象棋中,你只需“殺”王即可獲勝,而在圍棋中,你需要通過計數(shù)或比較來計算結(jié)果,而不是簡單地殺掉對手的棋子。 此前,“深藍(lán)”計算機的設(shè)計者在2007年發(fā)表文章稱谷歌人工智能李世石,他相信超級計算機能夠在十年內(nèi)擊敗人類圍棋。
此外,此次發(fā)布也是Deep MInd自2014年1月被谷歌收購以來首次發(fā)聲。在被收購之前,這家總部位于倫敦的人工智能領(lǐng)域公司還獲得了特斯拉和創(chuàng)始人馬斯克的投資。
186信息網(wǎng)原創(chuàng)文章,轉(zhuǎn)載請注明本文來自:www.yjdjwpb.cn