四川快乐12有几种玩法:四川快乐12任五走势图手机

NEWS新聞

四川快乐12任五走势图手机 www.ztxea.icu 最近正在折騰...
Recently is to do ...

2017年,AI在人類設計的所有游戲中都打敗了人類

UPTATED:2017/12/28 16:12:08 | 分類:公司新聞

aa2.jpeg

【網易智能訊 12月28日消息】在20世紀的大部分時間里,國際象棋是人工智能研究人員的一個基準。早在上世紀50年代初,約翰?麥卡錫提出了“人工智能”一詞,他曾把國際象棋稱為“人工智能領域的果蠅”,這一說法來源于早期對果蠅的研究對遺傳學領域的影響。

上世紀90年代末,IBM的“深藍”與世界冠軍加里?卡斯帕羅夫進行了一系列國際象棋比賽。

在1997年,深藍最終擊敗了卡斯帕羅夫,這是機器第一次在比賽中擊敗世界冠軍。到本世紀早中期,這項技術已經進步到了一定程度,在幾乎所有不同玩法的游戲中,機器都在不斷地打敗國際象棋大師。

自然而然地,人工智能開發者開始轉向其他更復雜的游戲,以測試他們日益復雜的算法。在過去的12個月里,人工智能跨越了一系列的新門檻,最終在各種不同的游戲中擊敗了人類玩家,從古老的圍棋游戲到動態互動的紙牌游戲,德州撲克。

從國際象棋到圍棋

上世紀90年代末,機器終于徹底打敗了國際象棋大師后,一位來自普林斯頓的天體物理學家評論說,“可能要等上一百年,電腦才能在圍棋中打敗人類——甚至可能更長?!?/p>

于是計算機科學家們又把研究的注意力轉向圍棋,這是一個來自中國的古老的策略游戲,非常容易學會,但是很難做到精通。

在過去的十年中,機器學習的發展創造了真正有競爭力的人工智能圍棋選手。2014年,谷歌開始開發一個名為AlphaGo的深度學習神經網絡。在經歷了幾年的接近成功之后,開發團隊嘗試了一些不同的東西。

在2016年末,一個名為“Master”的神秘網絡圍棋選手出現在了亞洲熱門游戲服務器Tygem上。在接下來的幾天里,這個神秘的玩家在于許多世界冠軍的比賽中占據了主導位置。到2017年1月4日,官方確認“Master”實際上是DeepMind的AI AlphaGo的最新版本。

2017年5月,AlphaGo “Master”打敗了柯潔——世界上排名第一的圍棋選手。在AlphaGo和柯潔對戰的三場比賽中,這臺機器一直處于優勢地位,但最令人吃驚的是,在10月份的時候,谷歌已經研究出了一個比“Master”更先進的AlphaGo版本。

aa1.jpeg

根據《自然》雜志的一篇文章中,AlphaGo Zero是一種革命性的算法,它能夠迅速地自學圍棋。這個系統一遍又一遍地與自己對戰,掌握了不同情況下的游戲方法。經過21天的學習,AlphaGo Zero已經達到了“Master”的水平。40天后,它就已經超過了之前所有版本的技能水平。

到2017年12月,DeepMind推出了一個更先進的系統版本。這款名為AlphaZero的新人工智能可以在幾小時內掌握多種游戲。經過8個小時的自我訓練,該系統不僅可以擊敗之前的AlphaGo Zero,還可以完全掌握國際象棋和日本將棋。

掌握撲克牌中的“欺詐”術

盡管圍棋游戲的復雜度已經非常之高,但對于人工智能來說,圍棋和撲克采用是兩種完全不同的模式。要想在撲克游戲中取勝,你需要掌握一定的欺詐技能。欺詐以及識別他人的欺詐是在紙牌游戲中取勝需要掌握的關鍵技能。

經過十多年的嘗試,在2017年,兩項獨立研究顯示,人工智能終于打敗了一流的撲克牌專業人士。來自加拿大阿爾伯塔大學的研究人員推出了一個人工智能系統,DeepStack,它可以用一種人工智能形式的“直覺”來全面控制人類撲克玩家。

卡內基梅隆大學的一個研究小組在2017年1月舉辦了一場更加公開的活動,當時它的Libratus AI系統花了20天時間,與四名專業的撲克玩家一起玩了12萬局無限注“德州撲克”。盡管專業人士每天晚上都在討論他們可以利用人工智能的哪些弱點,但這臺機器每天都在改進自身,修補游戲玩法中的漏洞,改進策略。

人類的大腦無法與機器匹敵,在經過近一個月的不間斷游戲之后,這臺機器總共贏了170萬美元,而這4位專業人士中的每一位都損失了數千美元的虛擬貨幣。其中一名專業玩家對《連線》雜志說:“在這次激烈的比賽中,我感覺自己在和一個作弊的人比賽,就好像我的牌可以被他看到一樣。我不是在指責它作弊。這其實是一件好事?!?/p>

埃隆·馬斯克的AI研究

2015年,埃隆?馬斯克和一小群投資者成立了一個名為OpenAI的項目。該項目旨在探索人工智能系統的發展,尤其是在強化學習方面。在這種系統中,機器可以教會自己如何在特定的任務中提高自己的能力。

2017年8月,OpenAI團隊將目光投向了征服Dota 2,這是一場名為“The International”的大型電子競技錦標賽中的核心比賽。Dota 2是一款非常受歡迎且非誠復雜的多人在線對戰游戲,在競技游戲領域是一項嚴肅的比賽。

aa3.jpeg

在僅僅兩周的學習之后,OpenAI機器人就加入到了這場錦標賽中,隨后擊敗了世界上的幾名頂尖選手。目前人工智能系統只被訓練過較為簡單的一對一版本的游戲,但OpenAI團隊正在研究如何讓AI掌握五對五的“團隊”游戲。

AI通過分工玩轉“吃豆人”游戲

幾年前,谷歌DeepMind對其人工智能在49款雅達利2600的游戲中進行了訓練。只要有和人類玩家相同的輸入,AI就會知道如何玩這些游戲并在游戲中獲勝。事實證明,有些游戲確實比其他游戲更難以駕馭,在這些經典的、眾所周知非常困難的游戲中,20世紀80年代的一款電子游戲“吃豆人”尤其具有挑戰性。

2017年,谷歌收購了一家名為Maluuba的深度學習創業公司,并將其并入DeepMind。Maluuba的新型機器學習方法被稱為“混合式獎賞架構”(HRA)。將這種方法應用到吃豆人系統中,該系統創建了150多個個體代理,每一個都有特定的目標——比如找到一個特定的豆子,或者避免幽靈。

aa4.jpeg

HRA方法生成一個高級代理,類似于高級經理。在做出每一步的最終決定之前,這個高級代理會評估所有來自下級代理的建議。這種方法被委婉地稱為“分而治之”,即把復雜的任務分解成更小的部分。

在將這個方法應用到吃豆人之后,AI很快就掌握了如何獲得999990分的高分,這是之前沒有人或人工智能能做到的。

AI將開始設計游戲

如果人工智能能在幾乎每一場比賽中擊敗我們,那我們下一步該干什么?

法爾茅斯大學的一名研究人員最近公布了一種機器學習算法,他聲稱這一算法可以為我們創造出自己的游戲,我們從零開始玩游戲。這個人工智能系統名為Angelina,它每天都在不斷改進自己,但目前它已經可以利用從維基百科共享到在線報紙以及社交媒體等各種來源的數據集制作游戲。

那么這一切意味著什么呢?

也許2017年最重大、最可怕的發展是強化學習系統的巨大進步。這些程序可以有效地教會它們自己如何掌握新技能。例如,最近的AlphaZero迭代可以在幾天的自主學習之后,在一些游戲中獲得超能力。

一項對350多名人工智能研究人員進行的大規模調查顯示,人工智能還不足以打敗我們。這項調查預測,在10年內,人工智能將會比我們更優秀,到2049年它將能夠寫出一部暢銷小說,到2053年,它將會比人類在外科手術中表現的更好。事實上,該調查得出的結論是,到2060年,人工智能將有50%的幾率能夠完成我們所能做的所有事情,并且效果會更好。

2017年無疑是人工智能在日益復雜的游戲中打敗人類的里程碑式的一年,盡管這看起來是一項微不足道的成就,但它的影響是巨大的。許多這些人工智能開發公司正迅速將目光投向現實世界的挑戰。

谷歌DeepMind已經將AlphaGo Zero的系統應用到了其他領域,并進行了一項有關蛋白質折疊的全面研究,以期揭示治療阿茲海默和帕金森等疾病的治療方法。


“最終,我們希望利用像這樣的算法突破來幫助解決各種現實世界問題中亟待解決的問題,”DeepMind的共同創始人兼首席執行官杰米斯?哈扎比斯(Demis Hassabis)說,“如果類似的技術可以應用于其他結構性問題,比如蛋白質折疊、減少能源消耗或尋找革命性新材料,那么取得的突破將有可能加強人類對這個世界的理解,并對我們所有人的生活產生積極影響?!?/p>