久久ER99热精品一区二区-久久精品99国产精品日本-久久精品免费一区二区三区-久久综合九色综合欧美狠狠

博客專欄

EEPW首頁 > 博客 > CMU 發(fā)明“聽音識物”機器人,準(zhǔn)確率接近 80%

CMU 發(fā)明“聽音識物”機器人,準(zhǔn)確率接近 80%

發(fā)布人:深科技 時間:2020-08-16 來源:工程師 發(fā)布文章

近年來,機器人各個方面的能力都在快速追趕人類,甚至在某些領(lǐng)域已經(jīng)超過人類。在這一過程中,科學(xué)家和工程師們最喜歡在機器人身上打造出類似人類的感官模式,以更好地感知世界。


不過現(xiàn)階段的很多技術(shù)都只專注于再現(xiàn)人類的視覺和觸覺,比如炙手可熱的計算機視覺技術(shù)。相比之下,復(fù)制人類其他感官的研究卻沒有太多進(jìn)展。


卡內(nèi)基梅隆大學(xué)(CMU)的研究小組近日發(fā)表一項新成果——探索如何利用聲音開發(fā)感知功能更先進(jìn)的機器人。


他們將機器人命名為 Tilt-Bot,字面意思是 “傾斜機器人”,實際上它是一臺通過傾斜托盤研究物體運動和聲音之間關(guān)系的機器,訓(xùn)練后可以實現(xiàn)一定程度的 “聽音識物”,準(zhǔn)確率接近 80%。研究成果以論文的形式發(fā)表在《機器人學(xué):科學(xué)與系統(tǒng)》 Robotics: Science and Systems 上。



聽覺與視覺、觸覺一樣,都是人類收集信息的重要渠道。那么聽覺可以為機器人帶來什么呢?在回答這個問題之前,我們可以想象一下沒有聲音的世界。


在這種情況下,我們將極度依賴視覺系統(tǒng)收集信息??匆曨l必須有字幕,與別人溝通必須用文字和手勢,永遠(yuǎn)不知道背后是不是走過來一個人,除非轉(zhuǎn)過頭去看。


即使眼睛和手可以代勞,很多關(guān)鍵信息也無法準(zhǔn)確傳達(dá),比如語氣、聲調(diào)以及這些變量背后的潛臺詞和深意。


機器人也面臨著相似的苦惱:感知物理世界的渠道太過單一,依賴性過強,因此無法有效利用普遍存在的信息。如果能有效收集聲音數(shù)據(jù),再配合上視覺信息,它們對環(huán)境的感知力將大幅提升。


CMU 團(tuán)隊以此為核心思想,設(shè)計出了 Tilt-Bot 機器人。它本質(zhì)上是一臺托盤機器人,由擁有多個關(guān)節(jié)的機械臂、托盤和固定裝置組成,托盤四周有邊框,上面貼著用于記錄物體撞擊的聲波捕捉裝置。


托盤的正上方還固定了一個攝像頭,用于捕捉物體運動軌跡,后期再與聲音變化相匹配。



實驗時,研究人員會把不同的物體放到托盤中,機械臂隨后開始向前后左右傾斜,托盤中的物體也隨之移動。


如果傾斜過大,物體就會撞到邊框并發(fā)出響聲,撞擊力度越大,捕捉到的聲波波峰也就越高。


團(tuán)隊總共收集了 60 個不同物體的 1.5 萬次交互記錄,每組記錄都包含匹配的視頻和音頻數(shù)據(jù)。他們用這些數(shù)據(jù)創(chuàng)建了全新的圖像 + 音頻數(shù)據(jù)集,用于訓(xùn)練機器人在動作、圖像和聲音之間建立有意義的聯(lián)系。


一個有趣的發(fā)現(xiàn)是,受過訓(xùn)練的機器人只需要分析物體滑動和撞擊的聲音記錄,就可以區(qū)分不同物體。


即使同是金屬質(zhì)地的螺絲刀和扳手也可以成功分辨,總體成功率接近 80%。這意味著訓(xùn)練機器人學(xué)習(xí)物體的音頻表示形式是有意義的。


另一個更有價值的發(fā)現(xiàn)是,音頻有時比視覺提供的有價值信息更多,或者說適用面更廣。


由于聲音是以聲波的形式傳播的,其傳播軌跡更直觀,可以更有效地預(yù)測物體未來的運動軌跡,從而幫助機器人更好地控制物體。


用從未見過的物體測試機器人性能時,如果同時使用視頻和音頻數(shù)據(jù),那么它預(yù)測如何更好操控物體的表現(xiàn)相較于只使用視頻時提升了 24%。


包含音頻和視頻的數(shù)據(jù)集可以幫助更多人開發(fā)機器人,尤其當(dāng)它們被派去執(zhí)行的任務(wù)需要兩者兼顧時。研究團(tuán)隊表示現(xiàn)在的成果只是第一步,未來將探索聲音數(shù)據(jù)分析還能挖掘出機器人的哪些潛力,進(jìn)一步提高它們的感知能力,并且將其運用到更實際的任務(wù)中。


“這些初步研究成果是令人興奮的,證明了機器僅憑聲音就能識別出物體類型,” 研究人員萊雷爾·平托(Lerrel Pinto)表示,“這樣一來,機器人執(zhí)行任務(wù)的時候就可以更有針對性,比如學(xué)會區(qū)別對待空酒杯和滿酒杯。”



*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。



關(guān)鍵詞:

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉