AlphaGo戰勝李世石:人類向右 機器向左

為期數天的人機圍棋大戰,最終以 AlphaGo 4比1的勝利拉下帷幕。回想比賽之前,李世石其實被很多人看好,畢竟是世界頂尖九段高手而且還曾經贏了14個冠軍。而最終李世石只是憑借機器的重大失誤而扳回一局,AlphaGo 的強大特別是大局觀令很多職業選手震驚。

面對這個幾乎被碾壓的結果,對很多人可以說是意料之外。

圍棋是迄今為止人類發明的最複雜的遊戲。在小小的19乘19的棋盤上,雙方各持黑白,輪流下子,只要一方將另一方子圍住就可以吃掉。國際象棋只有64個格子,而圍棋卻有361個格子,其策略選取的複雜度已經加大了好幾十個量級。而圍棋的難度更在於,在看似簡單的遊戲規則裏面,每一步的變化加上「打劫」等特殊規則所產生的運算複雜度是天文數字量級的。

有人計算過,要是把圍棋所有的狀態用窮舉法全部列出大概需要 10的170次方(相比之下國際象棋只有10的46次方)。因此,圍棋也被認為是人工智能攻克信息完全博弈遊戲最後的堡壘。

縱觀人機對戰的歷史,往往是以機器的勝利而告終。1997年IBM的深藍打敗了國際象棋世界冠軍卡斯帕羅夫。2011年IBM的Watson在智力問答電視比賽中徹底打敗兩名世界冠軍。

短短不到幾年的時間,人工智能又攻破了幾乎永遠不可能被攻破的領域——圍棋。如果說,相比1997年IBM深藍的暴力博弈樹遍歷而言,深藍的勝利只是硬件速度的勝利和計算機的勝利。AlphaGo今天的勝利才真正是人工智能的勝利,它標誌著真正人工智能的時代已經開啟。

Image caption 1997年IBM的深藍打敗了國際象棋世界冠軍卡斯帕羅夫

其實人工智能作為一個學科已經發展了半個多世紀,一直有一群默默無聞的人們從事著這方面的研究,而這次人機大戰才真正的把人工智能放在的鎂光燈下,成為大眾矚目的焦點。

如果說之前的深藍電腦還處於「暴力」人工智能的階段,現在的以AlphaGo為代表的深度學習和強化學習把人工智能推向了頂峰。通過Google發表的文章 可以看出,通過深度學習採用海量的專業棋譜訓練策略網絡,再用強化學習通過自我博弈訓練估值網絡,最終結合兩個網絡通過蒙特卡洛樹進行下子決策。

可以看出,這一套流程並不是一種技術的勝利,而是多種人工智能技術結合的產物。這也是近幾年來人工智能的發展方向,通過結合多種模型對問題進行分層和抽像,從而部分地模擬了大腦認知、思考和決策過程。

AlphaGo今天的完勝將會對人類的未來產生深遠的影響。為此,有人歡呼雀躍,有人憂心忡忡。歡呼者為人類在這一領域取得的長足進步而高興,憂心者擔心機器將會在未來取得越來越明顯的優勢,從而最終會取代人類。

牛津大學的一份研究報告已經表明未來70%的工作將有可能被機器所取代。我們在未來會看到人工智能被應用在越來越多的領域,特別是需要進行決策領域,比如智能駕駛,醫療診斷,金融交易等。

Image caption 相信人類智慧將會和人工智能分工協作,取長補短,相互學習,共同提高

近期的連線雜誌Wired就報道了總部位於香港的Aidyia混合多種人工智能進行進行金融交易,並且可以通過表現不斷改進。總部位於紐約的Rebellion Research也推出了完全由人工智能運營管理的投資基金。

總部位於倫敦的對衝基金機構Castilium用人工智能模擬交易員和基金經理的推理和決策過程,並將其用於自動化交易。

無疑,未來是機器智能和人類智慧共存的時代。其實面對人工智能,人類大可不必驚慌。人工智能系統還很大程度上依賴於特徵提取和訓練方式,還遠未達到通用系統的程度。雖然AlphaGo取得了突破性進展,但是也只是在信息完全的領域的突破,人工智能在很多信息不完全領域還是一籌莫展。

機器向左, 人類向右。我們都知道,人的大腦是不對稱的,右腦與直覺和情感有關;左腦與邏輯和決策有關。 也許未來人工智能將會在左腦的領域超越人類,而面對於人類的靈性、感情和情緒人工智能還是一片空白。在不久的將來,相信人類智慧將會和人工智能分工協作, 取長補短,相互學習,共同提高。

(責編:歐陽成)

本文不代表BBC的立場和觀點。網友如要發表評論,請使用下表:

Your contact details
Disclaimer