原標(biāo)題:微軟研究員用HoloLens為視障人士帶來(lái)社交可能性 來(lái)源:砍柴網(wǎng)
據(jù)估計(jì),全球各個(gè)年齡段的視障人士總數(shù)為2.85億,其中3900萬(wàn)是盲人。為了向所述人群提供幫助,微軟于2016年啟動(dòng)了由美國(guó)、英國(guó)、中國(guó)、日本和印度研究人員通力合作,并旨在探索可以幫助殘障人士與周圍世界交互的技術(shù)的東京計(jì)劃(Project Tokyo)。四年后,這個(gè)項(xiàng)目結(jié)出了又一個(gè)果實(shí):微軟HoloLens頭顯的改良版本,其配備了可提供周圍環(huán)境人士信息的算法。
根據(jù)微軟的博文介紹,研究小組首先跟蹤了具有不同視力水平的運(yùn)動(dòng)員和觀眾從英國(guó)到巴西里約熱內(nèi)盧殘奧會(huì)的旅程,觀察所述人員在導(dǎo)航機(jī)場(chǎng),參加運(yùn)動(dòng)場(chǎng)館和進(jìn)行觀光等活動(dòng)時(shí)是如何與他人互動(dòng)。然后,東京計(jì)劃團(tuán)隊(duì)的機(jī)器學(xué)習(xí)專家開(kāi)發(fā)了上述算法,而這種可提供周圍人士信息的算法由與HoloLens對(duì)接的PC中的圖形處理單元執(zhí)行。另外,改良版的HoloLens移除了前端透鏡。
固定在HoloLens攝像帶上方的LED燈帶將追蹤最靠近用戶的人士,并在識(shí)別后變綠,從而告知通信伙伴或旁觀者知道他們已被看見(jiàn)或提示他們避讓。計(jì)算機(jī)視覺(jué)模型可以檢測(cè)環(huán)境中人員的姿態(tài),從而提供他們位于何處以及相距多遠(yuǎn)的感覺(jué)。另一個(gè)模型則分析攝像頭的片段,從而識(shí)別人員并確定是否需要向系統(tǒng)告知其名字。
所有信息都通過(guò)音頻提示傳遞給佩戴者。例如,如果改良版HoloLens在用戶左側(cè)一米遠(yuǎn)的位置檢測(cè)到一個(gè)人,它會(huì)發(fā)出一聲聽(tīng)起來(lái)像是來(lái)自左側(cè)大致距離的咔嗒聲。如果識(shí)別出所述人士的臉部,它將發(fā)出另一種聲音,并且如果確認(rèn)為已知的人士,系統(tǒng)將告知其姓名。另外,單獨(dú)的第二層聲音會(huì)將用戶引導(dǎo)面向所述人士的臉部。
當(dāng)HoloLens的攝像頭對(duì)準(zhǔn)所述人士的鼻子時(shí),用戶會(huì)聽(tīng)到尖銳的喀噠聲。如果知識(shí)所述人士,系統(tǒng)會(huì)向用戶告知其名字。用戶同時(shí)可以要求獲取概述,并獲取系統(tǒng)已識(shí)別人員的姓名的空間讀數(shù),并且當(dāng)有人直接看著用戶時(shí),系統(tǒng)可以發(fā)出空間警報(bào)聲。
微軟表示,他們正在使用縮小版技術(shù)來(lái)幫助盲人和弱視兒童開(kāi)發(fā)社交能力。
微軟正在積極地為改善殘障人員的生活而努力。這家科技巨頭早前為相關(guān)社區(qū)帶來(lái)了旨在幫助弱視用戶導(dǎo)航周圍世界的移動(dòng)應(yīng)用Seeing AI,并在最近推出了使用雙耳音頻來(lái)幫助視障用戶構(gòu)建思維導(dǎo)圖并在陌生空間中選擇個(gè)人路線的Soundscape。
通過(guò)于2018年5月宣布的AI for Accessibility,微軟承諾在未來(lái)五年內(nèi)向?yàn)闅埣踩碎_(kāi)發(fā)AI工具的大學(xué),慈善組織以及其他機(jī)構(gòu)開(kāi)發(fā)提供2500萬(wàn)美元資金。AI for Accessibility旨在通過(guò)每個(gè)財(cái)政季度的種子撥款和后續(xù)融資來(lái)獎(jiǎng)勵(lì)在工作,生活和人際關(guān)系這三個(gè)類別中最具前景的候選項(xiàng)目。