2011年9月13日 星期二

當演算法統治世界

看不見的算法正在掌控著我們與數字世界的互動,從谷歌網站上圖書、電影和音樂的算法到Facebook網站上推薦朋友的算法;從操縱華爾街交易的代碼再到各種搜索引擎代碼,算法似乎無聲地滲入到我們的世界並重塑著我們身處的世界。


    然而,令我們揪心的是,我們正在慢慢失去對這些代碼的控制,而且,算法也並不總是正確,算法出錯將會給我們的生活帶來巨大的影響。在上個月舉行的全球TED大會(指全球技術、娛樂、設計大會,每年,TED大會在美國召集眾多科學、設計、文學、音樂等領域的杰出人物,分享他們關于技術、社會、人的思考和探索)上,算法專家凱文•斯萊文警告稱,現在,到了我們更透徹地了解算法並想方設法“馴服”它的時候了。

    “算法為王”

    斯萊文在全球TED大會上發表演講稱,“計算機用來做決定的數學”正在以“隨風潛入夜,潤物細無聲”的方式,慢慢滲透進我們日常生活的方方面面。

    在每個智能網頁的背後都隱藏著更加智能的網頁代碼︰谷歌網站上為我們推薦圖書、電影和音樂的是算法;Facebook網站上為我們推薦朋友的也是算法;在華爾街縱橫捭闔的是算法;在好萊塢預測票房的也是算法。

    這些看不見摸不著的計算正在慢慢掌控著我們與電子世界的相互交流,這是一個“算法為王”的時代。“我們正在編寫一些自己也看不懂的東西,我們把一些事情變得更加復雜,難以理解。我們正在慢慢失去對這個我們自己創造的世界的理解和掌控。”斯萊文警告稱。

    算法影響好萊塢

    隨著代碼變得越來越復雜,它的觸角正在深入我們生活的各個層面,包括我們的文化偏好。

    推薦引擎是全球最大的在線影片租賃網站Netflix公司的一個關鍵服務,1000多萬顧客都能在一個個性化網頁上對影片做出1到5的評級。Netflix將這些評級放在一個巨大的數據集里,該數據集容量超過了30億條。Netflix使用推薦算法和軟件來標識具有相似品味的觀眾對影片可能做出的評級。

    百分點推薦引擎的首席執行官柏林森表示︰“網絡正從一個搜索時代進入一個發現時代,推薦引擎無所不在。當人們並不十分清楚需要某個東西存在,或者不完全清楚自己的具體需求時,推薦引擎能幫助他發現自己所需要的東西。這就是Netflix影片推薦引擎的成功所在。”而且,兩年來,Netflix還使用舉行大獎賽的方法來提高影片推薦的效果,2010年Netflix大獎的獲獎團隊成功地將Netflix的影片推薦引擎的推薦效率提高了10%。正是基于此, Netflix現在承擔了全球60%的電影網上租賃業務。

    無獨有偶,英國電影公司Epagogix也正在將電影的劇本、情節、明星、拍攝場地等各種要素集合在一起,使用其自行研制出的算法預測電影的票房收入。該公司首席執行官尼克•米尼表示︰“這套系統將幫助制片公司決定是否制作一部電影。只需要你將劇本提交給我們,我們就可以算出這部電影的票房收入為多少。”

    比如,他舉例說,如果一部電影的預算成本為1.8億英鎊,但是,算法計算得出,其票房收入可能只有3000萬英鎊,說明這部電影並不值得投資開拍。

    很多電影人對這種算法深感困擾,米尼自己也表示︰“拍攝電影的原因很多,我們的算法只是幫助人們更好地做決定,何樂而不為呢?”

    斯萊文表示︰“重點在於,上述種種例子並不是谷歌,也不是信息,不是金融統計,而是文化,算法正在形成改變我們文化的物理學。”

    算法掌控華爾街
    在金融領域,代碼的地位也越來越重要,頗有“代碼為王”的架勢。現在,華爾街70%以上的交易依靠所謂的黑盒子或者算法交易(閃電交易)運行。銀行家和股票經紀人也聞風而動,他們不僅招聘聰明的交易員,還大量雇佣聰明的物理學家和數學家。斯萊文說︰“現在,有2000多名物理學家在華爾街工作。”

    算法出錯,影響巨大

    或許在某些方面,算法要比人聰明,但並非總是如此,由人編寫的算法也並非永遠正確。

    《蒼蠅誕生記》(The Making of a Fly)是一本分子生物學方面的書籍,主要講述的是一只蒼蠅從卵到完全成長為幼蟲的過程,盡管這本書可能非常吸引人,會給人帶來美好的閱讀體驗,但它無論如何也不值2360萬美元的售價。然而,今年年初,這本書在亞馬遜網站上的標價確實高達2360萬美元,造成這一情況的主要原因是亞馬遜公司的定價和改價算法開始互相競標。

亞馬遜 1730萬英鎊(2360萬美金)的教科書 這演算法還真高貴


    “這是算法在沒有人監管時的自相矛盾。”斯萊文表示,當代碼變得足夠聰明,在無人干預的情況下很可能會經常出現這種混亂。

    算法失誤也曾導致美國華爾街股市崩盤。在2010年5月6日發生的所謂“2︰45的瞬間崩潰”中,美國股票市場的9%消失了5分鐘。

    一名馬虎的交易員因為道瓊斯指數下降10%受到了指責,但其實,這名交易員當時正在使用的計算機程序才是“罪魁禍首”。短短20分鐘之內,這個算法將7.5萬股股票以26億英鎊(約為42.57億美元)的價格拋售,導致其他高頻交易算法如法炮制,股市9%的財富瞬間消失,所有人目瞪口呆。沒有人知道究竟發生了什麼事情,然而,幾分鐘之後,市場恢復正常。

    所謂成也蕭何敗也蕭何,交易算法在讓交易更加方便快捷的同時,也承擔著巨大的風險,千里之堤毀于蟻穴,小小的錯誤可能就會帶來致命的打擊。這就促使監管者必須引入斷路器,在機器開始表現失常,算法出錯時果斷將交易終止。

    算法將我們困於“過濾泡沫”中

    谷歌公司的秘密代碼將其推上全球最有實力的公司之一的寶座。確實,這些代碼使得搜索變得更加容易,然而,也不斷有科學家對谷歌公司的算法提出批評。

    MoveOn.org董事長埃利• 帕雷瑟在其所寫《過濾泡沫》一書中表示,當前,我們使用互聯網的方式正悄然發生著巨大的變革,諸如谷歌這樣的搜索引擎提供的信息也日益個性化,這些互聯網過濾器會記錄用戶可能會喜歡的對象,並試圖以此進行預測。這些過濾器實際上是一種預測引擎,它會持續不斷地建立和完善一個預測機制,來推斷你是什麼樣的人,你將要做什麼,你下一步想要什麼。經過整合以後,這些引擎將為每個人創建一個獨一無二的信息世界,並將其稱為“過濾器氣泡”,它將從根本上改變我們獲取觀點和信息的方式。

    然而這種個性化的數字“過濾器氣泡”會產生一個危險且意想不到的後果︰它們正限制著我們獲取信息的途徑和方式,使我們對新聞和文化的視野變得愈加狹隘,最終將對我們的日常生活和民主產生負面影響。

    而且,美國哥倫比亞科學家的最新研究表明,依靠搜索引擎獲取答案實際上改變了人類的思維方式。該報告的作者、哥倫比亞大學的心理學家貝琪•斯帕羅表示︰“自從搜索引擎問世後,人們就開始調整自己記憶信息的方式。我們的大腦依靠互聯網來記憶,就像依賴朋友、家人或同事來記憶信息一樣。現在,我們幾乎很少通過記住信息本身來記憶,而是更多地通過記住在何處找到這些信息來記憶。”

    而且,斯帕羅表示,人們更容易記住在互聯網的何處能找到這些信息,而不是記住信息內容本身。

    速度高於一切

    華爾街的算法可以看成是上世紀80年代湧現出的“雅痞”(住大城市、具有知識技能、講究生活品味的青年職業人士)的網絡版,只不過,華爾街的算法需要的不是雪茄、香檳,而是快速的運輸通道。

    斯萊文解釋道,因為華爾街的算法依賴於一個高於一切的特質︰速度,它們的運行時間以毫秒和微秒計算(點擊一下鼠標,要花50萬微秒),如果你是一個華爾街的算法,落後5微秒,你就是失敗者,因此,科學家們正在絞盡腦汁提高速度。

    美國延展網絡(Spread Networks)公司正在打造一條高速的光縴連接,該公司正在美國紐約市和芝加哥市之間鋪設一條825英里(1327公里)長的電纜線,其最終目的是將股票交易加快3微秒。凱文•斯拉文表示︰“我們正在用炸藥和岩石鋸打穿美國,讓算法能早3微秒完成交易,所有的一切都是為了一個前所未有的通訊系統。”

    另外,一條連接加拿大新斯科舍省和英國索默塞的光縴連接已被建立起來,以滿足股票交易員的需要,在60毫秒內在倫敦和紐約之間發送股票數據。

    隨著算法開始將其影響力延伸,並塑造我們身處的世界,現在,到了我們透徹地了解算法並想方設法對其進行“馴化”的時候了。








科技日報 2011/09/13 劉霞

相關連結
When algorithms control the world (BBC)

沒有留言:

張貼留言