霍金一直傾向于人工智能威脅論,認(rèn)為智能機(jī)器有一天會(huì)威脅人類安全。 但在與哈薩比斯進(jìn)行了四個(gè)小時(shí)的交談后,霍金似乎改變了態(tài)度。 介紹完負(fù)責(zé)人后,我們又把注意力轉(zhuǎn)了回來(lái)。 事實(shí)上,他已經(jīng)出名很久了。 他曾經(jīng)用Zen和Zen(兩個(gè)著名的圍棋程序)對(duì)弈了500場(chǎng),只輸了一場(chǎng)。 它還優(yōu)于由馬克·扎克伯格支持的流行圍棋程序 Dark。 它具有策略網(wǎng)絡(luò)( )和估值網(wǎng)絡(luò)( )的能力。 前者分析局勢(shì),預(yù)測(cè)對(duì)手的走法,后者則負(fù)責(zé)判斷勝率,可以在2微秒內(nèi)出棋。 黑暗只有第一個(gè)能力和所有招式。 花費(fèi)的時(shí)間也比較慢。 當(dāng)然,真正讓他成名的是他戰(zhàn)勝了歐洲圍棋冠軍樊麾,這在當(dāng)時(shí)引起了軒然大波,甚至還推高了谷歌的股價(jià)。 畢竟,這是計(jì)算機(jī)對(duì)人腦的勝利。 更重要的是,從計(jì)算機(jī)的角度來(lái)看,圍棋比國(guó)際象棋困難得多谷歌人工智能李世石,每一步棋的潛在組合都非常復(fù)雜。 有專家曾表示,十年之內(nèi)人工智能不可能掌握圍棋。 Go () 是一個(gè)圍棋人工智能程序,由英國(guó)倫敦 () 的 、 和 及其團(tuán)隊(duì)開發(fā)。 該程序使用價(jià)值網(wǎng)絡(luò)來(lái)計(jì)算情況谷歌人工智能李世石,使用策略網(wǎng)絡(luò)來(lái)選擇下一步行動(dòng)。
2015年10月,阿爾法圍棋5:0擊敗歐洲圍棋冠軍、職業(yè)二段棋手樊麾; 2016年3月,對(duì)陣世界圍棋冠軍、職業(yè)九段棋手李世石,李世石落敗。 ()是一個(gè)圍棋人工智能程序。 該程序使用價(jià)值網(wǎng)絡(luò)來(lái)計(jì)算形勢(shì),并使用策略網(wǎng)絡(luò)來(lái)選擇動(dòng)作。 Deep Go()的主要工作原理是深度學(xué)習(xí)。 深度學(xué)習(xí)是指多層人工神經(jīng)網(wǎng)絡(luò)及其訓(xùn)練方法。 一層神經(jīng)網(wǎng)絡(luò)以大量矩陣數(shù)作為輸入,通過(guò)非線性激活方法選擇權(quán)重,然后產(chǎn)生另一個(gè)數(shù)據(jù)集作為輸出。 這就像生物神經(jīng)腦的工作機(jī)制一樣。 通過(guò)適當(dāng)數(shù)量的矩陣,將多層組織連接在一起,形成神經(jīng)網(wǎng)絡(luò)大腦,進(jìn)行精確而復(fù)雜的處理,就像人們識(shí)別物體和注釋圖片一樣。 兩個(gè)大腦 Go(圍棋)通過(guò)具有不同神經(jīng)網(wǎng)絡(luò)的兩個(gè)大腦之間的協(xié)同工作來(lái)提高國(guó)際象棋水平。 這些大腦是多層神經(jīng)網(wǎng)絡(luò),其結(jié)構(gòu)類似于圖像搜索引擎用于識(shí)別圖像的神經(jīng)網(wǎng)絡(luò)。 他們從多層啟發(fā)式 2D 過(guò)濾器開始處理圍棋棋盤的定位,就像圖片分類器網(wǎng)絡(luò)處理圖像一樣。 經(jīng)過(guò)過(guò)濾后,13 個(gè)完全連接的神經(jīng)網(wǎng)絡(luò)層會(huì)對(duì)它們看到的位置做出判斷。 這些層能夠進(jìn)行分類和邏輯推理。 這些網(wǎng)絡(luò)通過(guò)反復(fù)訓(xùn)練來(lái)檢查結(jié)果,然后校對(duì)和調(diào)整參數(shù),使下一次執(zhí)行得更好。
這個(gè)處理器具有很大的隨機(jī)性,因此不可能準(zhǔn)確地知道網(wǎng)絡(luò)是如何思考的,但更多的訓(xùn)練將讓它進(jìn)化得更好。 第一個(gè)大腦:走棋選擇器(Move) Go的第一個(gè)神經(jīng)網(wǎng)絡(luò)大腦()是監(jiān)督學(xué)習(xí)策略網(wǎng)絡(luò)(),它觀察棋盤布局并試圖找到最佳的下一步棋。 事實(shí)上,它預(yù)測(cè)每個(gè)合法下一步的最佳概率,因此第一個(gè)猜測(cè)是概率最高的。 這可以理解為移動(dòng)選擇器。 第二大腦:()的第二大腦是回答與著法選擇器相關(guān)的另一個(gè)問(wèn)題。 它不是猜測(cè)具體的下一步行動(dòng),而是在給定棋子的位置的情況下預(yù)測(cè)每個(gè)玩家獲勝的概率。 這個(gè)態(tài)勢(shì)評(píng)估器就是價(jià)值網(wǎng)絡(luò)( ),它通過(guò)全局判斷來(lái)輔助走法選擇器。 這個(gè)判斷只是大概的,但是對(duì)于提高閱讀速度很有幫助。 通過(guò)將未來(lái)潛在的情況分類為好或壞,您可以決定是否更深入地閱讀特定的變體。 如果位置評(píng)估器說(shuō)這個(gè)特定的變體是不可能的,那么人工智能就會(huì)跳過(guò)讀取沿著這條線的任何進(jìn)一步的移動(dòng)。
186信息網(wǎng)原創(chuàng)文章,轉(zhuǎn)載請(qǐng)注明本文來(lái)自:www.yjdjwpb.cn