3月27日消息,谷歌宣布重啟機(jī)器人計(jì)劃,重新考慮對(duì)復(fù)雜機(jī)器人技術(shù)的關(guān)注,這項(xiàng)新工作在谷歌被稱為Robotics。
2013年,谷歌花費(fèi)了數(shù)千萬美元購買了美國和日本的六家機(jī)器人初創(chuàng)企業(yè),包括兩個(gè)專門研究與人類相似的機(jī)器的團(tuán)隊(duì)。但接下來的幾年里將收購的公司陸續(xù)變賣或關(guān)閉,波士頓動(dòng)力公司被日本企業(yè)收購后仍在研制能像人或動(dòng)物一樣移動(dòng)的機(jī)器人。
目前機(jī)器人已經(jīng)在倉庫和工廠車間使用,但它們只能處理特定任務(wù),例如拾取特定物體或轉(zhuǎn)動(dòng)螺絲。谷歌希望機(jī)器能夠自主學(xué)習(xí),使用人工智能為未來能夠?qū)W習(xí)投擲、滑動(dòng)、旋轉(zhuǎn)、擺動(dòng)、捕捉和其他運(yùn)動(dòng)技能的系統(tǒng)奠定基礎(chǔ),這些技能目前對(duì)最有能力的機(jī)器都構(gòu)成了挑戰(zhàn)。
雖然這些機(jī)器可能不像人形機(jī)器人那樣引人注目,但谷歌的研究人員認(rèn)為,內(nèi)在的更先進(jìn)的技術(shù)使它們在現(xiàn)實(shí)世界中具有更大的潛力。谷歌正在開發(fā)這些機(jī)器人自主學(xué)習(xí)技能的方法,例如在一堆不熟悉的物體中準(zhǔn)確抓取目標(biāo)物,或者在一個(gè)充滿障礙物的倉庫中導(dǎo)航。
谷歌學(xué)生研究員Andy Zeng在博客中寫道:“盡管在使機(jī)器人能夠高效地抓取物體、視覺自適應(yīng)甚至從現(xiàn)實(shí)世界中學(xué)習(xí)方面已經(jīng)取得了相當(dāng)大的進(jìn)步,但機(jī)器人操作仍然需要仔細(xì)考慮它們?nèi)绾问叭 ⑻幚砗头胖酶鞣N物體——尤其是在非結(jié)構(gòu)化環(huán)境中。”但是仍不確定機(jī)器人是否能將動(dòng)態(tài)變化形成物理直覺有效的完成任務(wù)。
Andy Zeng和他的同事們與普林斯頓、哥倫比亞和麻省理工學(xué)院的研究人員合作開發(fā)了拾取機(jī)器人TossingBot,這種機(jī)器人可以學(xué)習(xí)抓取物體,將物體扔進(jìn)目標(biāo)盒子里。它實(shí)現(xiàn)了兩倍的有效放置范圍,還可以通過自我監(jiān)督提高。
可預(yù)見性投擲對(duì)人類而言也非易事,抓握、姿勢、質(zhì)量、空氣阻力、摩擦力、空氣動(dòng)力學(xué)以及無數(shù)其他變量會(huì)影響物體的軌跡。Andy Zeng指出,通過反復(fù)試驗(yàn)對(duì)射彈物理進(jìn)行建模是可能的,但計(jì)算成本高,需要大量時(shí)間,并且很難形成普遍的規(guī)律。
TossingBot 使用投射彈道模型來估計(jì)將一個(gè)物體送到目標(biāo)位置所需的速度,并使用端到端的神經(jīng)網(wǎng)絡(luò),來模擬生物神經(jīng)元的數(shù)學(xué)函數(shù)層,也就是通過從高架攝像機(jī)獲得的視覺和深度數(shù)據(jù)進(jìn)行訓(xùn)練,來預(yù)測在估計(jì)值之上的調(diào)整。這種混合方法使系統(tǒng)的投擲準(zhǔn)確率達(dá)到85% 。
研究人員讓TossingBot首先嘗試錯(cuò)誤的抓取,再教會(huì)機(jī)器人抓取正確物品,偶爾隨機(jī)讓TossingBot投擲沒有測試過的物體,變換測試速度進(jìn)行訓(xùn)練來提高其學(xué)習(xí)能力。經(jīng)過大約14個(gè)小時(shí)的10,000次抓握和投擲嘗試后,TossingBot可以在87%的時(shí)間內(nèi)牢牢抓住雜亂堆中的物體。
經(jīng)過一兩個(gè)小時(shí)的訓(xùn)練,TossingBot 可以適應(yīng)從未見過的地點(diǎn)和物品,如假水果、裝飾物品、辦公室物品。
Andy Zeng表示,TossingBot可能學(xué)會(huì)更多地依賴幾何線索(例如形狀)來學(xué)習(xí)抓握和投擲,這些新出現(xiàn)的特征是在沒有任何明確監(jiān)督的情況下從零開始學(xué)習(xí)的,超出了任務(wù)級(jí)別的抓取和投擲。但TossingBot足以區(qū)分對(duì)象類別(乒乓球和記號(hào)筆)。
TossingBot 還沒有用易碎物體進(jìn)行過測試,它使用嚴(yán)格的視覺數(shù)據(jù)作為輸入,這可能妨礙了它在測試中對(duì)新物體做出反應(yīng)的能力。但研究人員表示將物理學(xué)和深度學(xué)習(xí)結(jié)合起來的基本構(gòu)想是未來工作的一個(gè)有希望的方向。
關(guān)鍵詞: