2011年5月14日 星期六

通過你的眼讓盲人"看"世界

雅思麗娜是一位盲人女孩兒,週末早上,她想從櫥櫃裡找點喝的。雖然她知道牛奶就放在罐裝食物的旁邊,但她打開櫥櫃後,用手裡的iPhone對著櫥櫃拍照,並錄音問道:“哪一個才是牛奶?”,雙擊屏幕後將她將問題發送出去。大約45秒後,她的iPhone告訴她“右邊的那個是牛奶”,答案完全正確。

她使用的是一款叫VizWiz的iPhone程式,該程式可以讓盲人招募遠程有視力的人幫他們實時解決一些日常遇到的視覺問題。比如,可以幫盲人讀郵件、搭配服裝、在餐廳看菜單、核對截止日期以及解釋路標等。用戶只需用手機拍張照片,問一個問題,然後就會收到多種回答。該程序能夠如此迅速並準確的原因在於它利用了計算機芯片和傳統的人類智能。

VizWiz的iPhone程式,該程式可以讓盲人招募遠程有視力的人幫他們實時解決一些日常遇到的視覺問題。


如果他們尋求幫助,你願意成為他們的眼睛嗎?

對人工智能研究人員來說,設計一款能準確識別文字和區分物體的計算機程式要面對很多挑戰。而為了解決這些問題,VizWiz幕後的研究人員(來自幾所大學的計算機科學家組成)決定將這些解決問題的任務外包給普通大眾,尤其是包給亞馬遜“土耳其機器人”(Mechanical Turk)的在線工作者。

為了保證能盡快回答問題,研究人員編寫了一個叫Quik Turkit的智能排隊系統來加速事情的處理速度。當一個VizWiz用戶正在拍照尋求幫助時,Quik Turkit就會招募“土耳其機器人”的工作人員,因此,總是會有人等著回答盲人的詢問。

有十一個盲人iPhone用戶測試了VizWiz程序,他們問的問題諸如“這張賬單的面額是多少?”“烤箱設置的溫度是多少”等等。每個問題平均會收到3個回答,每個問題的平均等待時間為133.3秒。其中第一個問題的準確度或者說幫助度大約為86%,剩下的問題回答完全準確。

在第二輪測試中,志願者使用VizWiz 2.0,該版本包括改良的圖像處理技術,回答時間縮短到平均27秒。

志願者對這一研究成果非常興奮,因為這對盲人來說無疑是一個大福音。如果他們尋求幫助,你願意成為他們的眼睛嗎?



麻省理工《科技創業》2011/05/12 常寧


相關連結

沒有留言:

張貼留言