文:《機器、平台、群眾》 圖:flick

學好圍棋,對人類來說並不容易,但讓電腦下很一手好圍棋更難,近乎不可能的挑戰。因為棋盤大,棋手有很高的自由度去下子,據估計在標準棋盤上,可能的狀態約有2´10170種(亦即2後面加上170個0)。比可觀測到的宇宙中的原子總數還要大(就算宇宙中的每一個原子本身就是一個充滿原子的完整宇宙,全部原子數量仍然少於圍棋棋盤上的可能狀態數目)

凡是試圖建造一部圍棋電腦的工程師,都遭遇到被稱為「波蘭尼弔詭」的嚴重障礙。因為工程師常倚賴模擬來幫助他們解決複雜環境,他們撰寫作出看起來不錯的棋步的程式,然後讓電腦探索對手對這一步的所有可能反應,再探索對對手的每一種可能反應可以作出的所有可能反應,依此類推,最終選擇的棋步具有最多好處、最少壞處的那一步。但是,因為有太多的棋局棋步,就算使用佔滿一整個廠棚數量的超級電腦,能夠模擬的充其量只有極小的一部分,少得幫不上忙。

2016年1月一篇科學報告揭露一部不再受挫的圍棋電腦,谷歌深智公司(Google DeepMind),發表研究報告〈用深度神經網路及搜尋樹演算法來精通圍棋〉,著名的《自然》科學期刊把它當成封面故事報導。這篇文章敘述圍棋應用程式AlphaGo找到避開「波蘭尼弔詭」的方法。

打造AlphaGo的工程師並不試圖把它設計成具有更優策略與捷思法的程式,他們建造了一部能夠自行學習它們的系統。方法是研究很多棋局中的很多棋盤狀態。AlphaGo被打造成能夠在大量資料中辨識微妙型態,把行動(例如移動棋盤上的一個特定點的一枚棋子)和結果(例如在一圍棋賽局中獲勝)關連起來。

他們讓這軟體去使用來自一個線上賽局資料庫的3000萬種棋盤,並告訴這軟體:「用這些去想如何贏」,同時AlphaGo也自己和自己下很多盤棋,產生了另3,000萬種棋盤,然後對這些狀態加以分析。這系統在賽局中進行模擬,但做的是高度聚焦性質的模擬,它使用研究數千萬種棋盤時獲得的累積學習,去模擬那些它認為最有可能引領出最終勝利的那些棋步。

AlphaGo的建造作業從2014年開始,到了2015年10月,已經可以一試身手了。研發團隊秘密地讓AlphaGo和當時的歐洲圍棋錦標賽冠軍棋手樊麾進行五局比賽,AlphaGo五局全勝。電腦圍棋在如此水準的比賽中獲勝,這完全稱呼意料之外,震驚人工智慧科技圈,幾乎所有分析師和評論家都稱AlphaGo的成就為一大突破。

不過,其等級仍然受到議論,神經學家蓋瑞.馬可斯(Gary Marcus)說:「圍棋在歐洲稱不上是一項普及的競技,歐洲冠軍在全世界僅排名第663。機器人若擊敗職網全球排名第663的運動員,那會令人印象深刻,但說它已經『精通』,仍然有失允當。」

深智團隊認為這論點有理,所以他們邀請南韓九段高手李世乭在2016年3月於南韓首爾和AlphaGo較量五局。李世乭人是當今人們記憶中最優秀的棋手之一,他的棋風被形容為:「直覺、無法預料、有創意、精深、古怪、複雜、深沉、快速、無章」,他覺得這些特色讓他相對於任何電腦有決定性優勢,他說:「圍棋賽有一種奧妙,我不認為機器了解這種奧妙……,我相信人類的直覺太先進,人工智慧還趕不上。」 李世乭預測他至少能贏得五局賽中的四局,他說:「看了10月時的比賽,我認為AlphaGo的程度無法跟我比。」

然而,李世乭與AlphaGo的人機對抗賽,AlphaGo贏了前三局,確立在五局三勝制中勝出,雖然李世乭贏了第四局,點燃一些觀察家懷抱人類辨察出數位機器內含缺點的希望。但是,就算數位機器內含缺點,也沒大到足以在第五局比賽造成不同,AlphaGo再度獲勝,最終以四勝一負贏了這場對抗賽。有關人工智慧的熱情與恐慌同時間在全世界蔓延開來…

書籍資訊:


CB635_機器、平台、群眾_立體書封300.png
機器、平台、群眾
科技正以空前速度改變每個產業及每個人的生活,

你該如何做,才能保持領先?
全球暢銷書《第二次機器時代》作者最新力作
★Amazon.com商業理財Top1 ★

Loading Facebook Comments ...

發表迴響