谷歌提供新框架 幫助機器人規(guī)劃路線自主“遠程出行”

 機氣林商城智能科技2019提供自動化零件,工控產(chǎn)品,工業(yè)機器人,以及機器人零部件、機械元件以及氣動元件等。機氣林商城,一站式機器人采購平臺

  機氣林電商有話說:

  谷歌機器人研究部門在一篇博客文章中表示,他們正在研究如何讓機器人自己進行長距離移動。高級研究科學家Aleksandra Faust和高級機器人軟件工程師Anthony Francis表示:“僅在美國,就有300萬人患有行動障礙,無法出門,機器可以幫助行動不便的人做一些簡單的事情,比如拿食品、藥品或包裹等?!?/p>

  在某種程度上,通過使用強化學習(RL)可以做到這一點,這是一種人工智能訓練技術(shù),它利用獎勵來驅(qū)動個體朝著目標前進。福斯特、弗朗西斯和他的同事們將強化學習與長距離規(guī)劃路線結(jié)合起來,編出能夠安全穿越短距離(約15米)且不會撞上移動障礙物的程序。他們利用AutoRL,一個自動搜索強化學習獎勵和神經(jīng)網(wǎng)絡架構(gòu)的工具,在模擬環(huán)境中進行訓練,再使用經(jīng)過訓練的程序構(gòu)建路線圖,或由節(jié)點(位置)和邊組成圖。

  使用傳統(tǒng)RL方法的訓練,仍存在許多問題,比如它需要花費時間迭代和手工調(diào)整獎勵,并在人工智能架構(gòu)方面不夠明智,更不用說減輕遺忘,這種現(xiàn)象是指人工智能系統(tǒng)在學習新信息時,突然忘記了以前學過的信息。

  AutoRL試圖通過兩個階段來解決這個問題,獎勵搜索和神經(jīng)網(wǎng)絡架構(gòu)搜索。在第一階段, 每個獎勵功能略有不同,在這個階段的最后,通常會選擇將帶到其目的地的獎勵。神經(jīng)網(wǎng)絡架構(gòu)搜索階段本質(zhì)上是第一階段的重復,但使用選定的獎勵來優(yōu)化網(wǎng)絡,并對累積獎勵進行優(yōu)化。

  這個自動化的訓練過程,可以減輕模型的遺忘情況,并且與現(xiàn)有技術(shù)相比,由此產(chǎn)生的策略的質(zhì)量更高(導航任務的質(zhì)量提高了26%),它們甚至足夠強大,可以在非結(jié)構(gòu)化環(huán)境中引導機器人。

  AutoRL制定的策略,對本地導航很有幫助,但遠程導航就需要用到概率路線圖了,它們是基于采樣的規(guī)劃器的一個子類,對機器人的姿態(tài)進行采樣,創(chuàng)建符合機器人特性的路線圖。

  福斯特和弗朗西斯解釋說:“首先,我們在一個通用的模擬訓練環(huán)境中對機器人進行訓練,訓練一個本地規(guī)劃策略。再根據(jù)該策略構(gòu)建一個PRM,稱為PRM-rl,它位于部署環(huán)境的平鋪圖之上,相同的平面圖可以用于任何機器人?!?/p>

  為了評估PRM-RL,谷歌的研究人員使用比培訓環(huán)境大200倍的辦公室樓層地圖構(gòu)建了一個路線圖,在20次試驗中,成功率達90%以上。


  【人氣商品】:

  機器林商城產(chǎn)品大推薦

  【品牌推薦】:

  機氣林電商爆款大曝光、機器人周邊產(chǎn)品總覽

  【最新資訊】:

   機氣林商城官網(wǎng)(網(wǎng)址打不開就+V:I99~46O3~9726機氣林)

  上海機氣林智能科技有限公司

  上海市青浦區(qū)華浦路 500 號

  電話:021-59801300