功夫機(jī)器狗!鵝廠機(jī)器狗穿越梅花樁:空翻、單樁跳、作揖
豐色 Alex 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI
機(jī)器狗會(huì)中國(guó)功夫是一種什么體驗(yàn)?
且看下面這只黑白狗,直接就是一個(gè)花式過(guò)梅花樁:
瞧這單樁跳:騰空一躍,四腳穩(wěn)穩(wěn)落在前方小圓盤上,連個(gè)趔趄都沒打。
當(dāng)然,站立和起身作揖這樣的傳統(tǒng)技能也不在話下。雖然是在樁子上,但狗子完全能控制好力道不至于摔跤。
更別提下樁時(shí),它還會(huì)耍一個(gè)完美的前空翻,穩(wěn)穩(wěn)落地結(jié)束表演。
真狗都很難做到吧~
如此身輕如燕的狗子很快就吸引了一波關(guān)注。
有人就表示希望再做大一點(diǎn),這樣就能當(dāng)坐騎了。(話說(shuō)見過(guò)騎狗的嗎)
還有網(wǎng)友想讓它可以幫忙取快遞……(這還差不多)
所以,這只靈活的機(jī)器狗,到底什么來(lái)頭?
它是Max二代機(jī)器狗,來(lái)自騰訊Robotics X實(shí)驗(yàn)室,今天正式對(duì)外亮相。
在一開始的訓(xùn)練思路上,騰訊的做法就和大眾不同。
我們知道,學(xué)會(huì)適應(yīng)復(fù)雜地形是大多數(shù)機(jī)器狗要學(xué)習(xí)的重要任務(wù)之一。
對(duì)于出現(xiàn)的踩歪、打滑等危險(xiǎn)情況,業(yè)界一般做法都是采用提?步頻、減慢速度、加?控制算法魯棒性的?段來(lái)恢復(fù)它們的平衡。
而騰訊選擇機(jī)器狗在梅花樁這樣“一旦踩歪踩錯(cuò)就沒有挽救機(jī)會(huì)”的極端地形上練習(xí),就是為了限制它們規(guī)劃路線的誤差范圍。
這樣一來(lái),機(jī)器狗就能夠做到一出腳就是對(duì)的,不需要試探、也不需要多余的動(dòng)作來(lái)維持或者恢復(fù)平衡,從而做到走得又快又穩(wěn)。
那么,Max是如何做到每一步都找準(zhǔn)樁?中?,精準(zhǔn)完成各種高難度動(dòng)作穿越梅花樁的呢?
簡(jiǎn)單來(lái)說(shuō),分為三大招:地圖識(shí)別、行動(dòng)軌跡規(guī)劃和動(dòng)作控制。
1、識(shí)別地圖和定位
Max面對(duì)的是一段全長(zhǎng)10米,高0.8米(Max兩倍身高),最小樁面直徑僅10厘米梅花樁陣列。
在上樁之前,系統(tǒng)并不會(huì)給Max配備先驗(yàn)地圖,也就是每次它面對(duì)的都是未知的地圖。
因此,它要學(xué)的第一件事就是識(shí)別地形,感知自己和梅花樁的位置,以便為后面的軌跡規(guī)劃做準(zhǔn)備。
據(jù)研究人員介紹,這一步最大的挑戰(zhàn)是如何在持續(xù)力沖擊下實(shí)現(xiàn)精準(zhǔn)視覺定位和地形識(shí)別,同時(shí)兼顧實(shí)時(shí)性與低延遲。
為此,他們給Max身上配備了單?RGB攝像頭、慣性傳感器(IMU)、深度傳感器等多種設(shè)備,所有傳感數(shù)據(jù)融合在一起獲得高質(zhì)量的環(huán)境數(shù)據(jù)。
在各傳感器數(shù)據(jù)融合過(guò)程中,一種啟發(fā)式的算法被用來(lái)保證數(shù)據(jù)一致性,并通過(guò)合理評(píng)估和選擇各種傳感器數(shù)據(jù)在優(yōu)化過(guò)程中的權(quán)重,保證定位實(shí)時(shí)、穩(wěn)定并具有魯棒性。
由于Max在移動(dòng)過(guò)程具有速度快、步頻?、?沖擊?等特點(diǎn),這會(huì)使得各種傳感器數(shù)據(jù)出現(xiàn)大量噪聲,引發(fā)干擾。
比如,在跳等動(dòng)作的持續(xù)力沖擊下,深度傳感器就會(huì)出現(xiàn)拖影現(xiàn)象。
因此,在地形的時(shí)域融合過(guò)程中,研究人員還引?了一個(gè)統(tǒng)計(jì)分布策略,它能在?效過(guò)濾錯(cuò)誤地形信息的同時(shí),保留精確的有效地形區(qū)域結(jié)果,估計(jì)出樁?中?相對(duì)于機(jī)器?的精準(zhǔn)位置,在?定程度上也能緩解梅花樁晃動(dòng)帶來(lái)的?擾。
最終,Max做到了地形識(shí)別精度?于2cm、視覺定位累積誤差?于1%。
建成的地形?度圖可以獲取平?任意坐標(biāo)對(duì)應(yīng)的?度以及局部法向。
2、規(guī)劃最優(yōu)行動(dòng)軌跡
看準(zhǔn)地形后,下?步Max要根據(jù)所?信息完成動(dòng)作軌跡規(guī)劃,最大的難點(diǎn)是如何在快速穿越的過(guò)程中,保證實(shí)時(shí)規(guī)劃出最優(yōu)的路線。
這里就采用了一種6D最優(yōu)軌跡?成技術(shù)。
所謂6D,除了X、Y、Z軸上的位置數(shù)據(jù),還包括機(jī)器狗需要做出的偏航、俯仰和滾動(dòng)維度的信息。
該生成技術(shù)可根據(jù)Max的運(yùn)動(dòng)步態(tài)、速度等指令,預(yù)估落腳點(diǎn),并根據(jù)落腳點(diǎn)周邊的地形?度圖,選出最優(yōu)的點(diǎn),也就是樁面中心。
此外,系統(tǒng)還會(huì)結(jié)合最優(yōu)點(diǎn),考慮Max運(yùn)動(dòng)過(guò)程中的動(dòng)?學(xué)約束、摩擦約束、?端?作空間約束等,進(jìn)行?次優(yōu)化,實(shí)時(shí)求解真正的最優(yōu)6D軌跡。
對(duì)于跳躍、空翻這類動(dòng)作,Max還需要達(dá)到的一個(gè)目標(biāo)是省?,即驅(qū)動(dòng)?最?化。
這里就用到了一種基于?線性優(yōu)化的軌跡規(guī)劃技術(shù)。
該技術(shù)可以兼容四腳跳(Pronking)和雙腳跳(Bounding)等多樣化步態(tài),通過(guò)跳躍距離、跳躍步態(tài)、最?關(guān)節(jié)?矩等約束條件,得出結(jié)果。
3、控制動(dòng)作,按軌跡精準(zhǔn)落點(diǎn)
動(dòng)作軌跡規(guī)劃好后,Max就可以開始正式?動(dòng),最大的考驗(yàn)是如何控制恰到好處的力、按照規(guī)劃軌跡實(shí)現(xiàn)精準(zhǔn)落點(diǎn)
在跟蹤參考軌跡方面,Max 采用了最新版xMPC+WBC(Model Predictive Control and Whole-Body Impulse Control,模型預(yù)測(cè)控制和全身控制)控制架構(gòu), 基于更精確的線性化動(dòng)力學(xué)模型,效果更好。
而在力控方面,據(jù)研究人員介紹,一般來(lái)說(shuō),動(dòng)作越是高動(dòng)態(tài)、越是不穩(wěn),就越要求控制精度。
本次表演的動(dòng)作中,每個(gè)環(huán)節(jié)都有自己的難度:
空翻屬于高動(dòng)態(tài),作揖、雙輪站立屬于易失穩(wěn);而對(duì)于單樁跳躍這個(gè)動(dòng)作,機(jī)器狗的四?落腳點(diǎn)距離很近,?撐區(qū)域很?,收攏的腿部姿勢(shì)也導(dǎo)致 Max的運(yùn)動(dòng)及發(fā)?空間受限,對(duì)力控的精度更是要求極高。
為了實(shí)現(xiàn)以上動(dòng)作的精準(zhǔn)力控,團(tuán)隊(duì)?研了一個(gè)模型預(yù)測(cè)控制算法,并給Max加?了基于關(guān)節(jié)?矩反饋的觸地檢測(cè)能?。
這個(gè)算法的相關(guān)論文登上了機(jī)器人領(lǐng)域頂會(huì)ICRA 2022。
對(duì)于平移運(yùn)動(dòng)的追蹤,自研線性模型預(yù)測(cè)控制算法獲得了和業(yè)界經(jīng)典算法同等的控制效果;而對(duì)于旋轉(zhuǎn)運(yùn)動(dòng)的追蹤,其表現(xiàn)甚至比其他算法更優(yōu)秀。
具體而言,這個(gè)算法利?軸?和指數(shù)坐標(biāo)來(lái)表示旋轉(zhuǎn)運(yùn)動(dòng),成功規(guī)避了之前線性化?法中的多個(gè)近似性假設(shè),如:??速度、轉(zhuǎn)動(dòng)慣量在預(yù)測(cè)窗?內(nèi)時(shí)不變等。
最終保留了更多的參數(shù),從?獲得了一個(gè)更精確的動(dòng)?學(xué)模型。
基于該動(dòng)?學(xué)模型,研究團(tuán)隊(duì)進(jìn)?步構(gòu)建了模型預(yù)測(cè)控制(model predictive control) 問(wèn)題,通過(guò)求解?次規(guī)劃(quadratic programming)的優(yōu)化問(wèn)題,來(lái)得出最優(yōu)?端接觸?。
此外,Max在做跳躍、前空翻等需要騰空的動(dòng)作時(shí),可利用關(guān)節(jié)?矩反饋來(lái)判斷四肢觸地狀態(tài),從而及時(shí)且精準(zhǔn)地進(jìn)?主動(dòng)的質(zhì)?軌跡規(guī)劃與柔順?控,有效避免身體大幅晃動(dòng),使整個(gè)動(dòng)作看起來(lái)更流暢絲滑。
由此,借助以上三大招的功夫,Max二代完成了精彩的花式過(guò)樁表演。
去年,一代Max亮相,當(dāng)時(shí)它就開創(chuàng)了腿輪一體化設(shè)計(jì),讓機(jī)器狗不僅能站起來(lái),還能滑著走。
這次,二代Max不僅學(xué)會(huì)了在樁上表演各種難度動(dòng)作,過(guò)樁速度也比國(guó)內(nèi)第一個(gè)會(huì)過(guò)樁的四足機(jī)器人Jamoca快了4倍。
除此之外,硬件方面,Max的輪足切換功能也做了改進(jìn),磁吸式的腿部鎖定機(jī)構(gòu)升級(jí)為了機(jī)械式的,并增加了沖擊力解耦設(shè)計(jì),最終提高了輪足切換的穩(wěn)定性。
以及Max的整體結(jié)構(gòu)上也進(jìn)行了拓?fù)鋬?yōu)化,增加了電池功率,外形上看起來(lái)更加緊湊簡(jiǎn)潔,在整機(jī)強(qiáng)度、抗沖擊性能等方面也有所提升。
研究人員表示,接下來(lái),他們會(huì)基于Max這個(gè)四足機(jī)器人平臺(tái),探索更精準(zhǔn)的傳統(tǒng)控制和AI控制算法,最終讓機(jī)器狗實(shí)現(xiàn)復(fù)雜環(huán)境下的任意行走。
看完了Max的精彩表演和它搭載的硬核技術(shù),再來(lái)了解下這只機(jī)器狗的誕生地——
成立于2018年的騰訊旗下機(jī)器人實(shí)驗(yàn)室:Robotics X。
目前,實(shí)驗(yàn)室里一共“養(yǎng)”了兩只“狗子”,除了Max還有一個(gè)叫Jamoca的前輩,它是國(guó)內(nèi)第一只學(xué)會(huì)走梅花樁的機(jī)器狗。
當(dāng)然,除了“狗子”之外,這個(gè)實(shí)驗(yàn)室里還有其他機(jī)器人成員:
比如會(huì)花樣空翻、靈活越障的輪式機(jī)器人Ollie。
可以保持平衡并自動(dòng)駕駛的摩托車。
該實(shí)驗(yàn)室的負(fù)責(zé)人張正友博士,是著名的AI和機(jī)器人研究員,現(xiàn)任騰訊最高專業(yè)職級(jí)——17級(jí)科學(xué)家。
同時(shí),他還是騰訊 AI Lab負(fù)責(zé)人,以及ACM Fellow和IEEE Fellow。
在加入騰訊之前,張正友曾任微軟人工智能及研究事業(yè)部首席研究員和研究經(jīng)理,在MSR工作了近20年。
正如前文介紹Max的未來(lái)發(fā)展方向所說(shuō),比起做簡(jiǎn)單、重復(fù)勞動(dòng)的機(jī)器人,Robotics X更關(guān)注機(jī)器人的自主特性研究,注重于讓其學(xué)會(huì)自主判斷、自主決策等。
最后,一個(gè)小彩蛋:
如果你覺得機(jī)器狗遛起來(lái)沒有靈魂,不妨看看這個(gè)場(chǎng)面。
雖為機(jī)器,Max二代卻會(huì)“撲腳”、“撒歡跑”,是不是有點(diǎn)遛真狗的意思了?
不過(guò),這其實(shí)是Max二代內(nèi)部AI訓(xùn)練完成后第一次測(cè)試時(shí)的樣子,研究人員表示:
當(dāng)時(shí)我們也不知道它會(huì)跑成什么效果,只是意外記錄下了這個(gè)視頻。
看來(lái)Max很有自己的想法??!(Doge)
當(dāng)然,如果想讓它成為一只聽主人話的狗, 通過(guò)指令即可對(duì)其發(fā)號(hào)施令。
本文來(lái)自微信公眾號(hào)“量子位”(ID:QbitAI),作者:關(guān)注前沿科技,36氪經(jīng)授權(quán)發(fā)布。