霽彩華年,因夢(mèng)同行—— 慶祝深圳霽因生物醫(yī)藥轉(zhuǎn)化研究院成立十周年 情緒益生菌PS128助力孤獨(dú)癥治療,權(quán)威研究顯示可顯著改善孤獨(dú)癥癥狀 PARP抑制劑氟唑帕利助力患者從維持治療中獲益,改寫晚期卵巢癌治療格局 新東方智慧教育發(fā)布“東方創(chuàng)科人工智能開發(fā)板2.0” 精準(zhǔn)血型 守護(hù)生命 腸道超聲可用于檢測(cè)兒童炎癥性腸病 迷走神經(jīng)刺激對(duì)抑郁癥有積極治療作用 探索梅尼埃病中 MRI 描述符的性能和最佳組合 自閉癥患者中癡呆癥的患病率增加 超聲波 3D 打印輔助神經(jīng)源性膀胱的骶神經(jīng)調(diào)節(jié) 胃食管反流病患者耳鳴風(fēng)險(xiǎn)增加 間質(zhì)性膀胱炎和膀胱疼痛綜合征的臨床表現(xiàn)不同 研究表明 多語(yǔ)言能力可提高自閉癥兒童的認(rèn)知能力 科學(xué)家揭示人類與小鼠在主要癌癥免疫治療靶點(diǎn)上的驚人差異 利用正確的成像標(biāo)準(zhǔn)改善對(duì)腦癌結(jié)果的預(yù)測(cè) 地中海飲食通過(guò)腸道細(xì)菌變化改善記憶力 讓你在 2025 年更健康的 7 種驚人方法 為什么有些人的頭發(fā)和指甲比其他人長(zhǎng)得快 物質(zhì)的使用會(huì)改變大腦的結(jié)構(gòu)嗎 飲酒如何影響你的健康 20個(gè)月,3大平臺(tái),300倍!元育生物以全左旋蝦青素引領(lǐng)合成生物新紀(jì)元 從技術(shù)困局到創(chuàng)新錨點(diǎn),天與帶來(lái)了一場(chǎng)屬于養(yǎng)老的“情緒共振” “華潤(rùn)系”大動(dòng)作落槌!昆藥集團(tuán)完成收購(gòu)華潤(rùn)圣火 十七載“冬至滋補(bǔ)節(jié)”,東阿阿膠將品牌營(yíng)銷推向新高峰 150個(gè)國(guó)家承認(rèn)巴勒斯坦國(guó)意味著什么 中國(guó)海警對(duì)非法闖仁愛礁海域菲船只采取管制措施 國(guó)家四級(jí)救災(zāi)應(yīng)急響應(yīng)啟動(dòng) 涉及福建、廣東 女生查分查出608分后,上演取得理想成績(jī)“三件套” 多吃紅色的櫻桃能補(bǔ)鐵、補(bǔ)血? 中國(guó)代表三次回?fù)裘婪焦糁肛?zé) 探索精神健康前沿|情緒益生菌PS128閃耀寧波醫(yī)學(xué)盛會(huì),彰顯科研實(shí)力 圣美生物:以科技之光,引領(lǐng)肺癌早篩早診新時(shí)代 神經(jīng)干細(xì)胞移植有望治療慢性脊髓損傷 一種簡(jiǎn)單的血漿生物標(biāo)志物可以預(yù)測(cè)患有肥胖癥青少年的肝纖維化 嬰兒的心跳可能是他們說(shuō)出第一句話的關(guān)鍵 研究發(fā)現(xiàn)基因檢測(cè)正成為主流 血液測(cè)試顯示心臟存在排斥風(fēng)險(xiǎn) 無(wú)需提供組織樣本 假體材料有助于減少靜脈導(dǎo)管感染 研究發(fā)現(xiàn)團(tuán)隊(duì)運(yùn)動(dòng)對(duì)孩子的大腦有很大幫助 研究人員開發(fā)出診斷 治療心肌炎的決策途徑 兩項(xiàng)研究評(píng)估了醫(yī)療保健領(lǐng)域人工智能工具的發(fā)展 利用女子籃球隊(duì)探索足部生物力學(xué) 抑制前列腺癌細(xì)胞:雄激素受體可以改變前列腺的正常生長(zhǎng) 肽抗原上的反應(yīng)性半胱氨酸可能開啟新的癌癥免疫治療可能性 研究人員發(fā)現(xiàn)新基因療法可以緩解慢性疼痛 研究人員揭示 tisa-cel 療法治療復(fù)發(fā)或難治性 B 細(xì)胞淋巴瘤的風(fēng)險(xiǎn) 適量飲酒可降低高危人群罹患嚴(yán)重心血管疾病的風(fēng)險(xiǎn) STIF科創(chuàng)節(jié)揭曉獎(jiǎng)項(xiàng),新東方智慧教育榮膺雙料殊榮 中科美菱發(fā)布2025年產(chǎn)品戰(zhàn)略布局!技術(shù)方向支撐產(chǎn)品生態(tài)縱深! 從雪域高原到用戶口碑 —— 復(fù)方塞隆膠囊的品質(zhì)之旅
您的位置:首頁(yè) >綜合知識(shí) >

alphago是什么算法(alphago是什么)

關(guān)于alphago是什么算法,alphago是什么這個(gè)問題很多朋友還不知道,今天小六來(lái)為大家解答以上的問題,現(xiàn)在讓我們一起來(lái)看看吧!

1、谷歌AlphaGo是什么?作為一種人工智能的AlphaGo,和IBM 在上個(gè)世紀(jì)打敗國(guó)際象棋大師卡斯帕羅夫的深藍(lán)超級(jí)計(jì)算機(jī),以及當(dāng)代的蘋果Siri、Google Now有著顯著的區(qū)別。

2、要解讀AlphaGo,首先我們需要了解AlphaGo背后到底是一個(gè)什么東西。

3、其實(shí)谷歌AlphaGo背后是一套神經(jīng)網(wǎng)絡(luò)系統(tǒng),由 Google 2014 年收購(gòu)的英國(guó)人工智能公司 DeepMind 開發(fā)。

4、這個(gè)系統(tǒng)和深藍(lán)不同,不是一臺(tái)超級(jí)計(jì)算機(jī),而是一個(gè)由許多個(gè)數(shù)據(jù)中心作為節(jié)點(diǎn)相連,每個(gè)節(jié)點(diǎn)內(nèi)有著多臺(tái)超級(jí)計(jì)算機(jī)的神經(jīng)網(wǎng)絡(luò)系統(tǒng)。

5、就像人腦,是由 50-100 億個(gè)神經(jīng)元所組成的,這也是為什么這種機(jī)器學(xué)習(xí)架構(gòu)被稱為神經(jīng)網(wǎng)絡(luò)。

6、你可以將AlphaGo 理解為《超驗(yàn)駭客》(Transcendence) 里約翰尼·德普飾演的人工智能,而它所控制的超級(jí)計(jì)算機(jī),就像影片里被人工智能心控的人類一樣,共同為一種蜂群思維 (Hive Mind) 服務(wù)。

7、《超驗(yàn)駭客》中,被人工智能控制的工人馬丁。

8、馬丁沒有所想,但他的所見將會(huì)被人工智能直接獲取。

9、AlphaGo 是在這個(gè)神經(jīng)網(wǎng)絡(luò)系統(tǒng)上,專為下圍棋 (Go) 而開發(fā)出的一個(gè)實(shí)例。

10、然而,雖然名字已經(jīng)介紹了它的功能,AlphaGo 背后的神經(jīng)網(wǎng)絡(luò)系統(tǒng)卻適合用于任何智力競(jìng)技類項(xiàng)目。

11、這個(gè)系統(tǒng)的基礎(chǔ)名叫卷積神經(jīng)網(wǎng)絡(luò) (Convolutional Neural Network, CNN) ,這是一種過(guò)去在大型圖像處理上有著優(yōu)秀表現(xiàn)的神經(jīng)網(wǎng)絡(luò),經(jīng)常被用于人工智能圖像識(shí)別,比如 Google 的圖片搜索、百度的識(shí)圖功能都對(duì)卷積神經(jīng)網(wǎng)絡(luò)有所運(yùn)用。

12、這也解釋了為什么AlphaGo 是基于卷積神經(jīng)網(wǎng)絡(luò)的,畢竟圍棋里勝利的原理是:對(duì)弈雙方在棋盤網(wǎng)格的交叉點(diǎn)上交替放置黑色和白色的棋子。

13、落子完畢后,棋子不能移動(dòng)。

14、對(duì)弈過(guò)程中圍地吃子,以所圍“地”的大小決定勝負(fù)。

15、AlphaGo Logo / DeepMindAlphaGo 背后的系統(tǒng)還借鑒了一種名為深度強(qiáng)化學(xué)習(xí) (Deep Q-Learning, DQN) 的技巧。

16、強(qiáng)化學(xué)習(xí)的靈感來(lái)源于心理學(xué)中的行為主義理論,即有機(jī)體如何在環(huán)境給予的獎(jiǎng)勵(lì)或懲罰的刺激下,逐步形成對(duì)刺激的預(yù)期,產(chǎn)生能獲得最大利益的習(xí)慣性行為。

17、不僅如此,AlphaGo 借鑒了蒙特卡洛樹搜索算法 (Monte Carlo Tree Search) ,在判斷當(dāng)前局面的效用函數(shù) (value function) 和決定下一步的策略函數(shù) (policy function) 上有著非常好的表現(xiàn),遠(yuǎn)超過(guò)上一個(gè)能夠和人類棋手旗鼓相當(dāng)?shù)膰宄绦颉?/p>

18、DeepMind 訓(xùn)練AlphaGo 的步驟說(shuō)明:10 萬(wàn)盤高手棋譜作為初始數(shù)據(jù),進(jìn)行分類后用于訓(xùn)練策略函數(shù);然后跟自己下棋;強(qiáng)化學(xué)習(xí)訓(xùn)練策略函數(shù),繼續(xù)下棋;下了 3000 萬(wàn)步后進(jìn)行回歸分析,整合蒙特卡洛樹搜索模型,訓(xùn)練效用函數(shù)。

19、AlphaGo 所采用的 DQN 是一種具有廣泛適應(yīng)性的強(qiáng)化學(xué)習(xí)模型,說(shuō)白了就是不用修改代碼,你讓它下圍棋它能下圍棋,你讓它在紅白機(jī)上玩超級(jí)瑪麗和太空侵略者,它也不會(huì)手生。

20、作為一個(gè)基于卷積神經(jīng)網(wǎng)絡(luò)、采用了強(qiáng)化學(xué)習(xí)模型的人工智能,AlphaGo 的學(xué)習(xí)能力很強(qiáng),往往新上手一個(gè)項(xiàng)目,玩上幾局就能獲得比世界上最厲害的選手還強(qiáng)的實(shí)力。

21、2014 年,已經(jīng)被 Google 收購(gòu)的 DeepMind,用五款雅達(dá)利 (Atari) 游戲 Pong、打磚塊、太空侵略者、海底救人、Beam Rider 分別測(cè)試了自己開發(fā)的人工智能的性能,結(jié)果發(fā)現(xiàn):在兩三盤游戲后,神經(jīng)網(wǎng)絡(luò)的操控能力已經(jīng)遠(yuǎn)超世界上任何一位已知的游戲高手。

22、DeepMind 用同樣的一套人工智能,不調(diào)整代碼就去測(cè)試各種各樣的智力競(jìng)技項(xiàng)目,取得了優(yōu)異的戰(zhàn)績(jī),足以證明今天坐在李世石面前的AlphaGo ,擁有多強(qiáng)的學(xué)習(xí)能力。

23、李世石執(zhí)黑子,AlphaGo 執(zhí)白子。

24、大約進(jìn)行了 85 分鐘時(shí)進(jìn)入休息階段在此之前,DeepMind 進(jìn)行過(guò)的無(wú)數(shù)虛擬棋局訓(xùn)練,以及去年擊敗歐洲圍棋冠軍樊麾二段的經(jīng)驗(yàn)讓AlphaGo 已經(jīng)訓(xùn)練出了頂尖的弈技,極有可能高于世界上任何已知的圍棋高手。

25、AlphaGo 的水平大約在專業(yè)六段左右。

26、再和其他圍棋程序的 495 盤較量中勝 494 盤;在讓 4 子的前提下仍有 75% 的勝率。

27、盡管棋盤上風(fēng)云變化,早在本次開戰(zhàn)前,AlphaGo 跟李世石就已不在同一起跑線上了。

28、根據(jù) DeepMind 透露的情況,從去年 10 月 5-0 擊敗樊麾二段到現(xiàn)在,AlphaGo 已經(jīng)在神經(jīng)網(wǎng)絡(luò)容量(數(shù)據(jù)容量)以及自己跟自己下棋用于訓(xùn)練的數(shù)據(jù)質(zhì)量上有了較大的提升。

29、而且神經(jīng)網(wǎng)絡(luò)的分布式計(jì)算延遲也得到了優(yōu)化,最終使得AlphaGo 能夠在兩小時(shí)的限定時(shí)間內(nèi)擊敗了李世石九段。

30、AlphaGo 只是 DeepMind 證明自己的一個(gè)工具。

31、你也可以將這次和李世石的對(duì)局理解為 Google 的公關(guān)策略。

32、2014 年,這家公司曾經(jīng)在其官網(wǎng)上寫道: DeepMind 致力于用研究深度學(xué)習(xí)的方式去真正了解智慧 (solve intelligence) 。

33、但對(duì)于 DeepMind 和 Google 來(lái)說(shuō),打造AlphaGo 以及其他人工智能神經(jīng)網(wǎng)絡(luò)不是終點(diǎn)。

34、DeepMind 三位聯(lián)合創(chuàng)始人將機(jī)器學(xué)習(xí)和神經(jīng)科學(xué)進(jìn)行結(jié)合,打造出一種“一般用途的學(xué)習(xí)算法”。

35、通過(guò)這種算法,DeepMind 和 Google 希望能夠?qū)⒅悄堋岸ㄐ突保斫庵悄苁鞘裁?,進(jìn)而更好的幫助人類理解大腦。

36、DeepMind 聯(lián)合創(chuàng)始人之一的 Demis Hassabis 曾經(jīng)寫道:用算法將智慧提煉出來(lái),有可能成為理解人類思維最神秘原理的最佳方式。

37、attempting to distil intelligence into an algorithmic construct may prove to be the best path to understanding some of the enduring mysteries of our minds.作為一種決策樹巨大的游戲,圍棋本來(lái)適合人腦思考,不適合機(jī)器運(yùn)算。

38、但 DeepMind AI 的方向就是模仿人腦思考,用神經(jīng)網(wǎng)絡(luò)“重現(xiàn)”智慧。

本文分享完畢,希望對(duì)大家有所幫助。

標(biāo)簽:

免責(zé)聲明:本文由用戶上傳,與本網(wǎng)站立場(chǎng)無(wú)關(guān)。財(cái)經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。 如有侵權(quán)請(qǐng)聯(lián)系刪除!

最新文章