今天的比賽結束后,雙方將于北京時間3月10日(星期四)、3月12日(星期六)、3月13日(星期日)、3月15日(星期二)中午12點進行剩余四場比賽。 本次比賽每方持續2小時,每分鐘倒計時3次。 游戲采用中國規則,黑棋為3子又3/4子(黑子為7子半)。 采用中國規則是因為圍棋是根據中國規則開發的。
圍棋一直被認為是最復雜的電腦游戲之一,因為其絕對步數大于宇宙中的原子數量谷歌人工智能李世石,這也是人工智能尚未解決的挑戰。 因此,這場人機游戲也引起了全世界的關注。
李世石1983年3月2日出生于韓國全羅南道,2006年3月12日與女友金賢珍結婚,同年9月3日生下女兒李惠琳。 1995年進入段位,1998年進入二段,1999年進入三段。2003年獲得LG杯冠軍后直接晉升六段。 2003年4月,在韓國最大的國際象棋比賽KT杯中獲得亞軍,并晉升七段。 2003年7月獲得第16屆富士通杯冠軍后,直接晉級九段。 2006年、2007年和2008年韓國圍棋獎 - 最杰出圍棋選手獎(MVP)。 棋風特點——李世石是典型的格斗棋風。 他善于抓住對手的弱點并主動出擊,以強大的力量擊敗對手。 他的攻擊可謂“穩、準、狠”。 他常常能夠從劣勢中完成逆轉。
Go () 是一個圍棋人工智能程序谷歌人工智能李世石,由英國倫敦 () 的 、 和 及其團隊開發。 該程序利用“價值網絡”來計算形勢,并利用“策略網絡”來選擇下一步行動。 2015年10月,阿爾法圍棋5:0擊敗歐洲圍棋冠軍、職業二段棋手樊麾; 2016年3月,挑戰世界圍棋冠軍、職業九段棋手李世石。
去年10月擊敗歐洲冠軍
谷歌在2014年以4億歐元收購了一家人工智能公司,該公司開發的項目已有兩年歷史,去年擊敗了歐洲圍棋冠軍樊麾(職業二段)。
去年10月5日至10月9日,谷歌以5:0的比分擊敗了歐洲冠軍。 除了擊敗人類之外,他還與其他圍棋程序對弈并贏得了 500 場比賽。
工作準則
傳統的人工智能方法是將所有可能的走法構造成一棵搜索樹,但這種方法并不適合圍棋。 谷歌此次推出的產品將先進的搜索樹與深度神經網絡相結合。 這些神經網絡通過包含數百萬個類神經連接的 12 個處理層傳遞棋盤的描述。
其中一個神經網絡,“決策網絡”( ),負責選擇下一步行動,另一個神經網絡,“價值網絡”(“ ”),預測游戲的獲勝者。谷歌用以下方法訓練神經網絡人類圍棋大師下了 3000 萬盤棋,同時該網絡還自行研究了新策略,在其神經網絡之間運行了數千盤圍棋,通過反復試驗來調整連接點,這一過程也稱為鞏固學習這是通過大量利用云平臺完成的大量研究工作。
在與人的博弈中,解決問題需要用到“兩個大腦”:“決策網絡”和“價值網絡”。 通俗地說,一個大腦用來決定當前應該如何走,另一個大腦用來預測游戲的最終勝利者。 ■
186信息網原創文章,轉載請注明本文來自:www.yjdjwpb.cn