基于深度學習的桿塔三維姿態實時估計
2021年電子技術應用第6期
李國強1,彭熾剛1,汪 勇1,向東偉2,楊成城2
1.廣東電網有限責任公司 機巡作業中心,廣東 廣州510062;2.武漢匯卓航科技有限公司,湖北 武漢430070
摘要: 針對目前無人機航拍影像桿塔識別算法中,普遍是無人機通過傾斜攝影技術獲取到桿塔的原始遙觀影像數據,經過機器學習訓練,識別其余圖片數據中的桿塔。其中存在獲取機器訓練所需的圖片數據來源緩慢、只能二維識別圖片中桿塔等問題。提出了基于深度學習的桿塔三維姿態實時估計的算法。首先,通過三維平臺合成影像數據;其次,通過Deep-Object-Pose訓練及其處理;然后測試真實的圖片數據或者實時視頻,達到智能識別桿塔的三維空間姿態信息。該算法為無人機自動尋找桿塔目標和智能精細化巡檢提供新的思路。
中圖分類號: TN014;TP183
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.200280
中文引用格式: 李國強,彭熾剛,汪勇,等. 基于深度學習的桿塔三維姿態實時估計[J].電子技術應用,2021,47(6):87-91,95.
英文引用格式: Li Guoqiang,Peng Chigang,Wang Yong,et al. Real-time estimation of three-dimensional attitude of towers based on deep learning[J]. Application of Electronic Technique,2021,47(6):87-91,95.
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.200280
中文引用格式: 李國強,彭熾剛,汪勇,等. 基于深度學習的桿塔三維姿態實時估計[J].電子技術應用,2021,47(6):87-91,95.
英文引用格式: Li Guoqiang,Peng Chigang,Wang Yong,et al. Real-time estimation of three-dimensional attitude of towers based on deep learning[J]. Application of Electronic Technique,2021,47(6):87-91,95.
Real-time estimation of three-dimensional attitude of towers based on deep learning
Li Guoqiang1,Peng Chigang1,Wang Yong1,Xiang Dongwei2,Yang Chengcheng2
1.Machine Operation Center,Guangdong Power Grid Co.,Ltd.,Guangzhou 510062,China; 2.Wuhan Huizhuohang Technology Co.,Ltd.,Wuhan 430070,China
Abstract: According to the current aerial image tower identification algorithm of UAV, it is common for UAV to obtain the original remote viewing image data of the tower through tilt photography technology, and identify the tower in the rest image data through machine learning training.Among them, there are some problems such as slow source of image data needed for machine training and two-dimensional identification of the tower in the picture.In this paper, an algorithm based on deep-object-pose is proposed for real-time aerial aerial aerial aerial recognition of the three-dimensional attitude of the tower.Firstly, image data is synthesized by three-dimensional platform.Secondly, deep-object-pose training and treatment were carried out.Then test the real picture data or real-time video, to achieve intelligent recognition of the tower's three-dimensional attitude information.The experimental results show that this algorithm will provide a new idea for uav to automatically find the target of tower and intelligent fine inspection.
Key words : Deep-Object-Pose;3D attitude recognition of tower;UAV;aerial image
0 引言
隨著國民經濟的增長和無人機在電網的逐步應用推廣,繁重的無人機作業任務讓無人機的智能化顯得尤為重要。同時,機器學習技術的飛速發展,給無人機的智能化提供了新的思路。但是,機器視覺的目前所需要的訓練數據是通過無人機等手段采集的,不僅耗時長、耗人力,而且檢測往往只是針對單張圖片,進行二維平面上的識別,面對實時視頻檢測比較卡頓,同樣無法識別物體三維空間姿態。
因此,需要改善視頻實時識別的卡頓,改進訓練數據的采集技術。傳統的目標檢測算法大多數以圖像識別為基礎。一般可以在圖片上使用窮舉法或者滑動窗口選出所有物體可能出現的區域框,對這些區域框提取特征并使用圖像識別分類方法,得到所有分類成功的區域后,通過非極大值抑制輸出結果。近些年來相關學者提出采用人工智能的方法實現目標檢測,其中包括K最近鄰KNN[1]、隨機森林Random Forest[2]、線性向量機SVM[3]。這些淺層機器學習方法在建模過程中功能簡單,復雜函數和分類問題的表達有限,魯棒性差,準確度和精度低。而對于難以應對指數增長的遙感圖像目標特征提取,也不能達到很好的特征分析和識別效果。
本文詳細內容請下載:http://m.rjjo.cn/resource/share/2000003580。
作者信息:
李國強1,彭熾剛1,汪 勇1,向東偉2,楊成城2
(1.廣東電網有限責任公司 機巡作業中心,廣東 廣州510062;2.武漢匯卓航科技有限公司,湖北 武漢430070)
此內容為AET網站原創,未經授權禁止轉載。