2009年1月5日 星期一

Google 的盲人科學家 T. V. RAMAN

TV RAMAN 是個好學的孩子,熱愛數學與解謎,14歲那年被青光眼奪走視力,然而他好學的天性並沒改變,從此他迷上技術與發明,並利用技術彌補視力的缺陷。他生在印度,靠志願者幫他朗讀教材讀完大學,他後來去了矽谷,成為被人尊敬的計算機科學家,現在Google 任工程師。

一路走來,Raman 設計了一系列工具幫助他使用那些原本不是為盲人設計的技術,包括點字魔術方塊,以及可以朗讀複雜數學公式的計算機程序,後者成為他在康乃爾(Cornell) 大學的博士學位論文。他還為盲人設計了一個專用Google 搜索。現年43歲的Raman 目前正修改他設計的一款觸摸屏手機,他表示,該手機是為盲人設計的。

美國盲人基金會的副總裁Paul Schroeder 說,Raman 設計的東西很奇特,他在可及性(accessibility )問題上的造詣首屈一指,他又非常獨特的能力讓技術滿足他的需要。

Raman 的一些發明可以設計成對任何人來說都更友好的電子設備或Web 服務,他的思路不是假如人看不見該怎麼做,而是,假如人沒在看屏幕時該怎麼做。這樣的系統對司機或那些不想將眼睛緊盯著手機上的人來說非常實用。

波士頓公共電視台WGBH 的Accessible Media 國家中心的Larry Goldberg 認為,Raman 的思路體現了人們對殘疾人專用產品同時造福正常人這一理念的認可,比如馬路上的輪椅專用道,電視字幕,光學字符識別技術,光學字符識別技術還被設計成軟件用來朗讀書籍。

從表面看,觸摸屏幕手機沒有任何鍵引導手指的操作,會很難用,但Raman 說,只要經過精心調整,那些配備了GPS 導航系統的觸摸屏手機會很好地為盲人指路。 Raman 說,你如何才會相信,你的手機會告訴你,前方200尺是X與Y的交叉路口,這完全是可行的。

盲人同情者長期以來一直批評那些缺乏可訪問性的公司產品,Web 在為盲人帶來機會的同時,也帶來很多障礙。一些讀屏軟件價格高達上千美元,而這樣的軟件仍有很多網站無法訪問。去年,零售商Target 的網站因為缺乏可訪問性而被聯合起訴,最終,Target 答應改造自己的網站以滿足盲人訪問。目前,能通過可用性與可訪問性驗證的網站仍寥寥無幾。

有一個挑戰是,技術的發展通常非常快,人們之前設計的網站可用性規則已經滯後。 W3C 於08年12月推出網站可訪問性規則2.0版,上一個版本是1999年發布的,那是,網站的內容主要還是靜態內容。網站的訪問障礙有多種形式,最常見的是用來阻止機器人自動發布信息用的CAPTCHA 機制,很少有網站同時提供語音CAPTCHA 以幫助那些有視力障礙的人。

有一些網站則設計得非常蹩腳,比如,電子商務站點的“Check out”按鈕經常是一個圖片,讀屏軟件根本無法識別。美國盲人理事會的Eric Bridges 表示,有大量的企業並沒有在他們的產品中為盲人提供平等的使用機會。而該理事會的Bridges 則表示,可訪問性應當深入新技術的核心,而不是在後期彌補。 Goldberg 說,其他方面的障礙者在Internet 上也遇到種種挑戰,比如,聽力障礙者發現很多視頻沒有字幕。

Raman 的盲人版 Google

在2005 年加入Google 之前,Raman 層在Adobe Systems 以及IBM 工作,他對可訪問性問題方面既是專家,又是親身體驗者。 2006年,他設計了一個對讀屏軟件更友好的Google 搜索版本,這個系統需要測試成千上萬的網頁。

你很難看到哪怕一個完全符合可訪問性指導規則的網頁,Raman 說,他的系統可以探測到那些支持讀屏軟件的網頁。不過,這個產品並沒像他想像得那樣被廣泛使用,但仍帶來一些衝擊。一些在Google 排名不好的網站主問Raman 他們怎樣才能有好的排名。

該系統還包含一個屏幕放大鏡幫助放大搜索結果,Raman 表示這個功能可以幫助那些弱視的人,但也可造福更多人群,尤其那些擁有小屏幕手持設備的人。他為自己定制了一個系統,可以更有效地使用多數PC和Web,這個系統會忽略那些影響速度的東西,比如,系統直接進入他經常閱讀的新聞網站的文字內容部分,而掠過那些導航性內容。

近來,Raman 正忙於一篇關於未來Web 結構的論文,他的辦公桌上有一個顯示屏,但很少開,除非在他需要向同事或來訪者顯示一些東西的時候。他在鍵盤上打字,頭微微側著,用無線耳機傾聽讀屏軟件發出的聲音。讀屏軟件做過調整,朗讀的速度是正常的3倍左右,對其他人,這個語速簡直無法辨認,但Raman 先生可以籍此實現和通過眼睛閱讀大體相仿的速度。

快速處理信息是他多年來練就的本領,他在YouTube 上有段視頻,在23秒內復原一個點字魔術方塊。不打字的時候,他經常吧一張紙用非常驚人的速度折成各種幾何圖形。在Google ,Raman 和一個25歲的名叫Charles Chen 的工程師共處一個辦公區,還有他的導盲犬Hubbell。 (Hubbell 還擁有自己網站)

陳先生視力正常,他開發了一個用於Firefox 的網頁朗讀軟件,他們最近一起設計了一些鍵盤快捷鍵,幫助盲人或弱視者快速翻閱Google 的搜索結果,他們還開發了一些工具,讓那些複雜的Web 程序,如e-mail 或博客閱讀器適合讀屏軟件的訪問。

Raman 的盲人觸摸屏手機


Raman 說,我現在最大興趣轉移到手機上,因為它極大地改變了生活。

為了展示他們的進度,Raman 從牛仔褲的口袋裡掏出他的T-Mobile G1 手機,這個觸摸屏手機安裝的是Google 的Android 系統,他和陳先生一起已經為手機設計了PC 機一樣的讀屏軟件。現在他們在做一些設計,讓盲人或任何人,在不看著屏幕的時候,可以輸入文字,數字和指令。他們的開發還可以彌補現有語音識別系統的不足,這些系統在噪音環境中往往無法可靠地工作。

因為Raman 無法準確地暗屏幕上的按鈕,他設計了基於相對位置的撥號器,該撥號器將手指觸到的任何位置視為5,要撥其它號碼,只需簡單地朝各個方向滑動手指,左上角為1,右下角為9,以此類推。如果撥錯號碼,只需將手機搖一搖刪除剛才的數字。他和陳先生正在測試多種輸入方法,但都沒完成,Raman 希望很快會有結果。

Raman 說,那些將改變生活的重要移動技術,如通過手機的攝像頭識別並朗讀路標,這樣的技術還有待時日。現在已經有一些設備可以識別並朗讀文字,但對盲人而言,盲人並不知道路標在哪裡,他們無法將手機對著它,一旦芯片的計算能力達到一定程度,他們就會識別路標的位置,並從任意角度識別出那些文字。這種最終會實現,而且,視力正常的人也會受益。如果在你駕駛的時候,你的手機能識別路標,這對任何人都有用,如果是在國外,還會將文字翻譯出來。

Raman 的發明已經出現在成千上萬的電腦中,1990年代,Raman 在Adobe 幫助實現了用讀屏軟件朗讀PDF 文件,聯邦政府要求這個功能,這個功能後來成了電子文檔的全球標準。 Adobe 創始人兼主席John Warnock 說,對我們公司,或者對盲人們來說,這非常重要。

Raman 說,他帶來的最大的影響是讓工程師們認識到他們產品中存在的可訪問性問題,或者說,讓他們知道這個領域額有大量等待解決的問題。他說,如果我能說服10個工程師加入到可訪問性問題的解決中,就是一個巨大的勝利。

COMSHARP CMS  2009/01/05


相關連結:For the Blind, Technology Does What a Guide Dog Can’t (New York Times)

沒有留言:

張貼留言