• 企業(yè)博客網(wǎng)bokee.net www.528008.cn http://creativedesign.blog.bokee.net/  深度解析谷歌人工智能計劃 打印此頁(yè)

    深度解析谷歌人工智能計劃

    http://creativedesign.blog.bokee.net    2016-4-5

       打敗了世界圍棋冠軍,這只是萬(wàn)里長(cháng)征的*步。

     
      加了墊子的墻,昏黃的燈光,花樣墻紙的天花板。這里一點(diǎn)也不像能做出改變世界的尖端發(fā)現。但在這些讓人快要幽閉恐懼癥的模擬走廊里,Demis Hassabis認為,他在為創(chuàng )造足以解決人性*大難題的軟件鋪設道路。
     
      “我們的目標很大,”Hassabis說(shuō),他冷靜穩健的風(fēng)格讓人無(wú)法想象他概念的大膽。他在谷歌DeepMind領(lǐng)導一只有200名計算機科學(xué)家和神經(jīng)學(xué)家的團隊,DeepMind就是在3月初打敗了人類(lèi)圍棋大師的AlphaGo背后的位于倫敦的團隊,創(chuàng )造了計算機歷史上的里程碑。
     
      但是,Hassabis說(shuō)這只是萬(wàn)里長(cháng)征的*步,作為人工智能領(lǐng)域的阿波羅計劃,目標“解決智能問(wèn)題,然后用它解決其他所有問(wèn)題?!比缃衽袛嘀悄苘浖臉藴示唧w到了一個(gè)特定的任務(wù)——面部識別。Hassabis希望創(chuàng )造他所稱(chēng)的“綜合智能”——像人類(lèi)一樣可以學(xué)會(huì )完成任何任務(wù)。他展望未來(lái)人工智能可以做各種事情,通過(guò)形成和測試科學(xué)假說(shuō)推進(jìn)醫學(xué)發(fā)展,或者用輕巧靈活的機器人身體跳來(lái)跳去。
     
      要實(shí)現這個(gè)目標,DeepMind的軟件必須超越黑白分明、秩序井然的圍棋世界。它需要掌握亂糟糟的真實(shí)世界——或者從一個(gè)昏暗的、像素化的模擬世界開(kāi)始。DeepMind的模擬世界叫做Labyrinth,公司在用它讓軟件嘗試非常復雜的任務(wù),例如在迷宮中導航。這會(huì )推動(dòng)DeepMind研究員鉆研如何制造更智能的軟件,推動(dòng)軟件學(xué)會(huì )面對更難的決策和問(wèn)題。他們利用了之前AlphaGo以及DeepMind更早炫耀過(guò)的技能,DeepMind學(xué)會(huì )玩二十世紀八十年代的太空入侵者等復古Atari游戲,玩得比人類(lèi)都好。但要成功,Hassabis必須想出辦法,解決人工智能領(lǐng)域中一些年代已久的問(wèn)題。
     
      自我改善
     
      39歲的Hassabis此生很多時(shí)間都在研究如何創(chuàng )造智能。當年象棋神童提早從高中畢業(yè),開(kāi)始了視頻游戲職業(yè)生涯。后來(lái)他獲得了神經(jīng)科學(xué)的博士學(xué)位,發(fā)布了關(guān)于記憶與想象的影響廣泛的論文。
     
      Hassabis在2011年聯(lián)合創(chuàng )建了DeepMind,將他所學(xué)的生物智能轉化到機器。公司在2013年12月發(fā)布了學(xué)會(huì )Atari游戲的軟件,在2014年初被谷歌收購,據報道金額達4億英鎊,當時(shí)超過(guò)六億美元。DeepMind快速擴張,新增雇傭幾十名研究人員,在頂尖機器學(xué)習和人工智能會(huì )議發(fā)表大量論文。今年一月,它宣布了AlphaGo的存在,以及AlphaGo在2015年12月打敗了歐洲*強圍棋玩家的消息。本月初,AlphaGo打敗了世界圍棋冠軍李世石。
     
      增強學(xué)習方法,是讓機器學(xué)習軟件學(xué)會(huì )更復雜任務(wù)的關(guān)鍵。
     
      Atari游戲和圍棋非常不同,但是DeepMind用同樣的方法解決了他們,從動(dòng)物的訓練方式中獲得靈感:馴獸師可以用獎勵與懲罰教會(huì )動(dòng)物新的招數。通過(guò)被稱(chēng)為“加強學(xué)習”的方法,軟件被設計為可以探索新的環(huán)境,調整自己的行為,以獲得某種虛擬獎勵。
     
      舉個(gè)例子,DeepMind的Atari軟件被設計為只能控制和看見(jiàn)游戲屏幕,具有增加分數的動(dòng)機。幾個(gè)小時(shí)的訓練就可以讓軟件提著(zhù)鞋帶起身,打到人類(lèi)專(zhuān)家。
     
      AlphaGo結合了增強學(xué)習和其他元素,例如一個(gè)分析幾千萬(wàn)個(gè)專(zhuān)業(yè)圍棋玩家棋譜從而學(xué)會(huì )評估不同走法的系統,還有一個(gè)搜索機制來(lái)選擇*佳走法。但是,讓AlphaGo能夠打敗世界冠軍的,是與自己練習幾百萬(wàn)次的增強學(xué)習。
     
      Hassabis認為,增強學(xué)習方法是讓機器學(xué)習軟件學(xué)會(huì )更復雜任務(wù)的關(guān)鍵,比軟件現在能玩的要復雜得多,例如記錄我們的話(huà)語(yǔ)、理解圖片的內容?!拔覀儾徽J為僅僅觀(guān)察就足夠智能,你還必須行動(dòng)?!彼f(shuō),“*終,這是*你可以理解世界的方法?!?
     
      DeepMind的三維環(huán)境Labyrinth,基于一個(gè)開(kāi)源的*人稱(chēng)射擊游戲Quake,專(zhuān)門(mén)為驗證該想法而設計。公司已經(jīng)用它來(lái)讓機器參與游戲,60秒內探索隨機生成的迷宮,收集蘋(píng)果或找到出口(可通往另一個(gè)隨機生成的迷宮)可獲得分數。未來(lái)的挑戰可能要去更復雜的計劃性——例如,懂得要是可以打開(kāi)門(mén)。公司還會(huì )以其他方式測試軟件,并在考慮挑戰星際爭霸和撲克牌。但是一段時(shí)期內,在Labyrinth里設置越來(lái)也難的挑戰將會(huì )是主要的研究方式,Hassabis說(shuō),“接下來(lái)幾年都夠用了?!?
     
      增強學(xué)習在未來(lái)的二至三年,會(huì )像深度學(xué)習一樣影響巨大。
     
      其他研究人工智能的公司和研究員會(huì )緊密關(guān)注著(zhù)。DeepMind增強學(xué)習的成功讓很多機器學(xué)習研究員吃了一驚。這項技術(shù)是二十世紀八十年代創(chuàng )建的,之前沒(méi)有其他訓練軟件的方法那么廣泛使用和效果強大,華盛頓大學(xué)研究機器學(xué)習的教授Pedro Domingos說(shuō)。DeepMind加強了這項技術(shù),把它和深度學(xué)習方法結合起來(lái)。深度學(xué)習*近有了重大突破,能讓計算機解碼圖片等信息,引發(fā)了*近機器學(xué)習的熱潮。
     
      “DeepMind所做的很了不起,”Domingos說(shuō)。但是他還說(shuō),Hassabis想做的是一個(gè)超越現在所有研究的火箭,還是后院里放的煙火,現在要下定論還為時(shí)過(guò)早——近期讓人眼花繚亂的成功不一定能持續?!癉emis對增強學(xué)習的樂(lè )觀(guān)態(tài)度不只是處于成功經(jīng)驗,”Domigos說(shuō),“機器學(xué)習和人工智能領(lǐng)域中,進(jìn)步不是線(xiàn)性的;我們有時(shí)候會(huì )突飛猛進(jìn),有時(shí)候會(huì )慢慢前行?!?
     
      Hassabis承認,業(yè)界”很多“人都懷疑增強學(xué)習的潛能,但是他們不會(huì )買(mǎi)賬?!拔覀冊绞巧钊?,越是感覺(jué)我們的理論是正確的,我想我們正在改變整個(gè)領(lǐng)域,”他說(shuō)?!拔覀冋J為增強學(xué)習在未來(lái)的二至三年會(huì )像深度學(xué)習一樣影響巨大?!?
     
      安全*
     
      DeepMind的成功目前支持Hassabis關(guān)于增強學(xué)習會(huì )有很多應用的說(shuō)法。AlphaGo的成功讓很多專(zhuān)業(yè)圍棋手和計算機專(zhuān)家驚訝,因為圍棋實(shí)在非常復雜,很難讓基本依靠計算不同走法可能結果的軟件勝利,也就是1997年IBM的深藍用來(lái)打敗世界象棋冠軍Garry Kasparov的方法。平均來(lái)說(shuō),象棋玩家每一步有35種可能的走法;在圍棋中,有250種。圍棋中位置可能性排列組合的數量,比宇宙中原子的數量都多?!跋笃迨且环N計算游戲,”Hassabis說(shuō),“圍棋太復雜,所有玩家靠的是直覺(jué)。在類(lèi)別上完全不一樣。你可以把AlphaGo想象成一個(gè)超級人類(lèi)的直覺(jué),而非超級人類(lèi)的計算?!?
     
    圍棋世界冠軍李世石回顧他1-4敗于A(yíng)lphaGo的比賽。圖片來(lái)源MIT Technology Review。圍棋世界冠軍李世石回顧他1-4敗于A(yíng)lphaGo的比賽。圖片來(lái)源MIT Technology Review。
      不論你是否同意AlphaGo具有直覺(jué),能讓軟件掌握更復雜的任務(wù)顯然很有用。DeepMind正在和英國國家健康服務(wù)的項目合作,訓練軟件幫助醫務(wù)工作人員發(fā)現腎臟問(wèn)題的跡象,這些問(wèn)題經(jīng)常被忽視,并造成大量可以避免的死亡。團隊還在和谷歌業(yè)務(wù)團隊合作,Hassabis說(shuō)他的技術(shù)可以讓虛擬助理浮現,改善推薦系統,這對于YouTube等產(chǎn)品非常重要(類(lèi)似的系統也是谷歌廣告產(chǎn)品的基礎)。
     
      能解決問(wèn)題的一個(gè)非主流辦法是,學(xué)習真實(shí)的大腦。
     
      更遠的未來(lái),DeepMind需要很多突破,才能往Hassabis解決智能的目標靠近,即使是未來(lái)幾年都在Labyrinth里面試驗。*關(guān)鍵的一個(gè)缺口是一種叫做分塊的技能,人類(lèi)和動(dòng)物的大腦用以處理世界的復雜性。Hassabis舉了個(gè)去機場(chǎng)的例子,你可以想好如何去機場(chǎng)并且完成計劃,而不用考慮走去門(mén)口的時(shí)候每一步走在哪兒,如何轉動(dòng)門(mén)把手或控制每一個(gè)肌肉纖維。我們可以用高層次的概念來(lái)計劃和行動(dòng),而不用考慮每一個(gè)細節,并且通過(guò)重新組合我們熟悉的“分塊”,或者概念,來(lái)適應新環(huán)境?!斑@大概是人工智能領(lǐng)域內未解決的*核心問(wèn)題之一?!盚assabis說(shuō)。
     
      這是許多研究團隊在鉆研的問(wèn)題,包括其他谷歌團隊。但是,DeepMind希望能解決問(wèn)題的一個(gè)非主流辦法是,學(xué)習真實(shí)的大腦。公司有一個(gè)由*研究員Mattew Botvinick領(lǐng)導的神經(jīng)科學(xué)家團隊,他直到*近一直是普林斯頓大學(xué)的教授。與大部分神經(jīng)科學(xué)研究不同的是,他們不僅要研究大腦如何運作,還要告訴DeepMind如何設計軟件。
     
      有一個(gè)近期試驗測試了Hassabis關(guān)于人腦如何組織概念的理論,利用一個(gè)偽造記憶的標準程序。它給測試對象呈現一系列相關(guān)詞,例如“冷”、“雪”和“冰”。人們經(jīng)常錯誤地記得聽(tīng)到一些其他相關(guān)詞,例如”冬天“。
     
      “根據我的機器學(xué)習概念,我想這一定暗示了那種概念信息如何在大腦中組織,“Hassabis說(shuō)。DeepMind團隊研究出一個(gè)大腦的顳葉前部如何組織概念的理論, 通過(guò)觀(guān)察正在進(jìn)行記憶任務(wù)的人的大腦,確認了理論的假說(shuō)。這項結果可能會(huì )改變DeepMind設計人工神經(jīng)網(wǎng)絡(luò )來(lái)呈現信息的方式。
     
      DeepMind的”待發(fā)現“列表上還有,將它在軟件上做過(guò)的、抓取文本意義的實(shí)驗,與Labyrinth中漫游的軟件實(shí)驗結合起來(lái)——有一個(gè)可能性是在虛擬空間內開(kāi)始擺上標識。Hassabis說(shuō),他還在計劃一種“野心勃勃”的方法,來(lái)測試是否準備好面對比Labyrinth更加真實(shí)的世界。他希望DeepMind未來(lái)可以控制機器人,他認為機器人受限于軟件對世界的理解能力?!坝幸恍┖芰瞬黄鸬臋C器人,不能充分發(fā)揮他們的能力因為還沒(méi)有算法?!彼f(shuō)。
     
      如果成功,那會(huì )引發(fā)一些關(guān)于人的本質(zhì)定義、以及人工智能的合理使用范圍等嚴肅的哲學(xué)和倫理問(wèn)題。Hassabis說(shuō),他鼓勵人們討論這項技術(shù)可能的風(fēng)險。(雖然他滿(mǎn)意地表示,物理學(xué)家Stephen Hawking在于他見(jiàn)面后,已經(jīng)停止警告人工智能會(huì )毀滅人類(lèi);將人工智能研究比作”召喚魔鬼“的Tesla創(chuàng )始人Elon Musk也被潑了冷水。)DeepMind有一個(gè)內部的哲學(xué)家、律師和商人團隊。Hassabis說(shuō)也許”很快“就會(huì )公布他們的名字,以及他也在努力召集一隊類(lèi)似的外部團隊,在多個(gè)計算機公司間共享。
     
      DeepMind的工程師們設計新實(shí)驗暫時(shí)還不需要倫理學(xué)指導,Hassabis說(shuō)?!本嚯x我們能擔心的成果還遠著(zhù)呢,“他說(shuō),”更重要的是讓所有人加快速度?!叭绻卸既鏗assabis所愿,他的倫理團隊才能真的有點(diǎn)事兒做。
    青青草原综合久久大伊人_日日摸夜夜欧美一区二区_99热这里只有精品9988_亚洲综合色区另类第一会所