bev自動(dòng)駕駛怎么樣?
BEV 自動(dòng)駕駛是當(dāng)前自動(dòng)駕駛領(lǐng)域的一個(gè)重要發(fā)展方向,具有諸多優(yōu)勢和特點(diǎn)。
BEV 感知算法全稱是“Bird-Eye-View(鳥瞰視角)”,它通過將多個(gè)視角的攝像頭圖像,統(tǒng)一通過公共的特征提取器,投影到同一個(gè) BEV 空間里。在這個(gè)過程中,攝像頭接收到影像,通過視覺神經(jīng)網(wǎng)絡(luò)的主干網(wǎng)絡(luò)提取影像中的特征值,然后借助 Transformer 算法,把多個(gè)攝像頭影像的特征值放進(jìn)一個(gè) 3D 空間里。
BEV 自動(dòng)駕駛的核心問題在于:
如何通過視角到 BEV 的視角轉(zhuǎn)換來重建丟失的三維信息;
如何獲取 BEV 網(wǎng)格中的真實(shí)標(biāo)注;
如何制定管線以納入來自不同來源和視圖的特征;
隨著傳感器配置在不同場景中的變化,如何適應(yīng)和推廣算法。
對(duì)于重建丟失的三維信息,目前有多種解決方案。比如通過深度估計(jì)網(wǎng)絡(luò),利用雷達(dá)作為深度的真值,深度細(xì)化模塊專門對(duì)深度估計(jì)部分進(jìn)行優(yōu)化。在獲取 BEV 網(wǎng)格中的真實(shí)標(biāo)注方面,需要高精度的標(biāo)注設(shè)備和技術(shù),以及大量的數(shù)據(jù)積累和優(yōu)化算法。制定管線納入不同來源和視圖的特征,可以采用解耦傳感器的方式,讓不同傳感器的數(shù)據(jù)都能投影到同一個(gè) BEV 空間。適應(yīng)不同場景變化的算法,則需要不斷訓(xùn)練和優(yōu)化模型,提高其泛化能力。
在實(shí)際應(yīng)用中,BEV 自動(dòng)駕駛有著出色的表現(xiàn)。它能顯著提升自動(dòng)駕駛系統(tǒng)的處理速度與準(zhǔn)確性,甚至可以基于先驗(yàn)知識(shí),對(duì)被遮擋的區(qū)域進(jìn)行預(yù)測,大大提升自動(dòng)駕駛對(duì)一些長尾問題(如“鬼探頭”)的預(yù)判能力。
目前,行業(yè)內(nèi)都在瞄準(zhǔn) BEV 算法,雖然模型還沒有完全收斂,但已經(jīng)有很多企業(yè)和研究機(jī)構(gòu)取得了重要的突破。比如上汽人工智能實(shí)驗(yàn)室依靠 BEV 視覺感知算法模型,在國際公開榜單 nuScenes 拿下“自動(dòng)駕駛檢測跟蹤算法”的全球第一。百度推出了車路一體的 BEV 感知方案 UniBEV,通過給傳感器做解耦、利用路側(cè)攝像頭、使用無人出租車的海量數(shù)據(jù)以及借助高精地圖等手段,發(fā)揮自身優(yōu)勢。
未來,BEV 自動(dòng)駕駛有望在深度估計(jì)、多傳感器融合、無參數(shù)網(wǎng)絡(luò)設(shè)計(jì)以及知識(shí)整合等方面取得進(jìn)一步的發(fā)展,為自動(dòng)駕駛帶來更安全、高效的解決方案。
(圖/文/攝:太平洋汽車 整理于互聯(lián)網(wǎng))
>>點(diǎn)擊查看今日優(yōu)惠<<