跨界 · 融合 · 服務 · 創(chuàng)新
基于視覺的無人機大范圍室外道路檢測及拓撲地圖構(gòu)建
王玉茜 張雪濤 閆 飛 莊 嚴
(1.大連理工大學控制科學與工程學院,大連 116024;2.大連理工大學人工智能學院,大連 116024)
摘 要: 空地協(xié)作中空中機器人對室外可行道路的檢測與建圖,有利于提升地面機器人的導航能力。為了實現(xiàn)上述功能,提出了一種新的基于道路分割、圖像拼接、骨架提取的無人機大范圍室外道路檢測及拓撲地圖構(gòu)建方法。首先,為了解決無人機基于航拍圖像的道路識別問題,通過D-LinkNet 網(wǎng)絡完成對無人機航拍圖像中道路的分割,并在保證分割準確率的情況下提升了分割的實時性。其次,考慮到無人機飛行高度和相機視角有限的問題,設(shè)計了基于GPU 加速的ORB 圖像拼接算法,從而實現(xiàn)了室外大范圍場景的獲取。然后,為了完成道路拓撲關(guān)系的建立,借鑒并行二值圖像細化算法,設(shè)計了用于道路拓撲化的骨架提取算法,進而得到了道路拓撲地圖。最后,所提方法在馬薩諸塞州道路數(shù)據(jù)集上進行測試,實驗結(jié)果驗證了該方法在道路分割、拓撲地圖構(gòu)建方面具有較高的準確性,且可滿足實時性要求。所建拓撲地圖有利于地面機器人導航能力的提升。
關(guān)鍵詞: 空地協(xié)作;拓撲地圖;D-LinkNet;道路分割;圖像拼接;骨架提取
1 引 言
近年來,隨著人類在人工智能、地圖構(gòu)建、圖像處理等領(lǐng)域取得突破性的科技進展,無人機和地面機器人也得到了迅速發(fā)展,二者各有利弊。一方面,無人機具有較廣的觀察視角,但其有效載荷低、續(xù)航時間有限;另一方面,地面機器人的視角受限制,但其有效載荷高、續(xù)航時間長[1]。如果利用無人機進行環(huán)境探索,從而引導地面機器人更快地完成作業(yè)任務,即空地協(xié)作,吸引了諸多學者研究[2-6]。文獻[7]提出了一種基于鳥瞰圖導航地面機器人的概念證明。文獻[8]利用無人機空中建圖,進而驅(qū)動地面機器人進行避障和路徑規(guī)劃。空地協(xié)作可以拓寬地面機器人的有限視場[9-10],可以用于虛擬現(xiàn)實[11]、多機器人監(jiān)控[12-13]、協(xié)同作戰(zhàn)[14]。而如何利用無人機對地面環(huán)境建圖是空地協(xié)作領(lǐng)域發(fā)展的一個關(guān)鍵問題。
本文目標是使用無人機生成可供地面機器人使用的室外大范圍拓撲地圖。為此,本文提出了一種基于道路分割、圖像拼接和骨架提取的大范圍拓撲地圖構(gòu)建方法,其中,圖像拼接技術(shù)可實現(xiàn)室外大范圍場景的獲取,道路分割和骨架提取可實現(xiàn)拓撲地圖的構(gòu)建。
為實現(xiàn)拓撲化地圖的構(gòu)建,首先需要無人機對地面道路的準確觀測,即對場景中的道路進行準確分割。在道路分割領(lǐng)域,基于航拍圖像的道路檢測技術(shù)的應用范圍越來越廣,道路識別也得到廣泛研究。文獻[15]基于視覺對車道線和道路邊界進行檢測,同時運用基于蒙特卡羅方法的置信度評價方法對待測圖像進行處理。該算法能夠有效地克服道路環(huán)境不佳的影響,并且計算耗時較小。然而,該算法僅適用于與環(huán)境背景特征相差較大的道路目標檢測,很難適用于背景環(huán)境復雜的無人機航拍圖像。文獻[16]提出了基于啟發(fā)式搜索連接的航拍圖像直線檢測方法,首先對圖像進行高斯濾波和邊緣檢測,然后利用啟發(fā)式搜索連接,提取出符合道路直線模型的直線,最終獲得檢測結(jié)果。該算法實現(xiàn)簡單并具有良好的抗噪性能。文獻[17]提出了基于霍夫變換的航拍圖像道路檢測,霍夫直線檢測作為直線提取的經(jīng)典算法,廣泛應用于直線檢測領(lǐng)域。文獻[18]針對道路顏色與周圍環(huán)境顏色存在明顯區(qū)別的情況,提出了基于顏色識別的道路檢測,但航拍圖像受屋頂、樹木陰影、車輛等影響較大,不適合應用此方法。隨著深度學習的發(fā)展,出現(xiàn)了多種基于神經(jīng)網(wǎng)絡[19-20]的航拍圖像道路提取方法,主要分為兩類:一類追求圖像分割的準確性,犧牲了時間;另一類則以快速為主,降低了準確性。為了兼顧時間與準確性,本文采用時間與準確性均衡的D-LinkNet 語義分割神經(jīng)網(wǎng)絡[21]。
其次,通過圖像拼接實現(xiàn)大范圍場景的獲取,在圖像拼接領(lǐng)域,Szeliski 提出了包含相機三維旋轉(zhuǎn)運動的圖像拼接技術(shù),該方法首先求解透視矩陣,然后求解單應性矩陣的參數(shù),調(diào)整焦距和旋轉(zhuǎn)矩陣以消除累積誤差,最后采用加權(quán)融合的方法將拼接圖像合成到一起。Brown 等[22-23]使用基于不變局部特征的物體識別技術(shù)來選擇匹配圖像,實現(xiàn)了無序圖像的全自動拼接,取得了較好的拼接效果。然而,當圖像數(shù)目較多時,邊緣圖像會發(fā)生畸變。為了解決這個缺陷,Gao 等[24]將場景劃分為背景平面和前景平面,用兩個單應性矩陣分別對齊背景和前景,進而無縫拼接大部分現(xiàn)實場景。隨后,文獻[25]采用網(wǎng)格優(yōu)化的方法來解決圖像拼接問題,從形狀矯正的角度出發(fā),借鑒圖像縮放的Shape-Preserving 類方法,非重疊區(qū)域逐漸過渡到全局相似變換,并對整個圖像 增加相似變換約束,矯正拼接圖像的畸變,減小了投影失真。Lowe[26-27]提出了尺度不變特征變換(Scale-Invariant Feature Transform, SIFT)算法,其具有尺度不變性,可在圖像中檢測出關(guān)鍵點,對于光線、噪聲、微視角改變的容忍度也相當高,但SIFT 算法計算量大,匹配速度較慢。因此,Bay 等[28]提出了快速魯棒特征(Speeded Up Robust Features, SURF)算法,它是SIFT 算法的加速版,其性能可與SIFT 相媲美,且比SIFT 快三倍。SURF 善于處理模糊和旋轉(zhuǎn)的圖像,但不擅長處理視點變化和照明變化。為解決SIFT 特征的高昂計算代價以及對噪聲敏感的弱點,Rublee 等[29]提出了特征提取算法(Oriented FAST and Rotated BRIEF,ORB),該算法基于FAST 和BRIEF 特征提出了二值特征,大大減少了計算量,提高了匹配速度,實驗表明,ORB 算法在時間上比SIFT 快100 倍,比SURF 快10 倍,并且匹配效果也較好。在道路分割后進行圖像拼接,可減少拼接時提取特征點的數(shù)量,大大減少了匹配拼接的計算量。除此之外,為了進一步提高匹配速度,本文設(shè)計了基于GPU 加速的ORB 圖像拼接算法,可以兼顧實時性與準確性。