年內(nèi)BEV落地之戰(zhàn):華為遙遙領(lǐng)先,還是蔚小理登上王座?
落地城市 NOA,是今年最重磅的自動駕駛大戰(zhàn)。而 BEV 感知,目前看來是通往城市 NOA 的必經(jīng)之路。
年內(nèi)落地 BEV,已經(jīng)是國內(nèi)自動駕駛頭部玩家的共識。
其實,BEV 是很早就提出的算法,又稱鳥瞰圖或上帝視角。直到近幾年,特斯拉將其用于自動駕駛領(lǐng)域,國內(nèi)車企隨之布局,才受到更多關(guān)注。
國內(nèi)涉足 BEV 的,造車新勢力有小鵬、蔚來、理想等,科技公司有百度、華為、毫末智行等。尤其今年 4 月,國內(nèi)新能源汽車龍頭比亞迪宣布年內(nèi)落地 BEV,將大戲推向高潮。
為何要落地 BEV?主要是自動駕駛場景發(fā)生了變化。
高速場景相對簡單,城市場景更為復雜,感知任務(wù)規(guī)模大幅增加,需要更多地利用深度學習。
感知層面,傳統(tǒng)的 2D 檢測已經(jīng)力不從心,只有 BEV 能更好地完成城市場景感知任務(wù),并為下一環(huán)節(jié)的規(guī)劃、控制打好基礎(chǔ)。
落地 BEV,最直觀的檢驗就是城市 NOA 功能能否在多個城市大規(guī)模推送。這場感知算法的重大轉(zhuǎn)變,考驗的是車企的算法自研功底。
進入城市,BEV 感知算法興起
故事從特斯拉重寫 Autopilot 軟件代碼開始。
2019 年,特斯拉推出高速場景下的 NOA(Navigate on Autopilot),小鵬、蔚來等造車新勢力緊隨,興起了一小股高速 NOA 技術(shù)潮。
直到 2020 年 8 月,馬斯克透露,團隊正在重寫 Autopilot 的底層代碼。
又過了兩個月,特斯拉推出 FSD Beta ,可以支持在城市道路場景下的 NOA。支撐城市 NO 功能的,便是全新的 BEV 感知算法。
為什么會出現(xiàn)這一變化?
毫末智行技術(shù)副總裁艾銳告訴 HiEV," 在特斯拉推出 BEV 之前,大家使用的是前視相機,周視用的很少。高速上,車密度不大,側(cè)后方用一些雷達也夠了。進入城市后,車流量開始密集,僅看正前方也不夠了。BEV 的出現(xiàn), 核心在于需要做 360 度的感知。"
特斯拉重寫代碼的同年,蔚來和小鵬也開始轉(zhuǎn)向。
蔚來引入原 Momenta 研發(fā)總監(jiān)任少卿,任的背景是計算機視覺研發(fā),加入蔚來后負責算法團隊,開始在 Mobileye 方案外啟動自動駕駛自研。
小鵬也開始研發(fā)基于 XNet 的 BEV 感知架構(gòu)。2021 年的 1024 科技日上,吳新宙透露,在過去 6 個月里,每一個預(yù)測和規(guī)劃代碼全是重寫的。
對于兩家重寫代碼這件事,均勝電子副總裁郭繼舜向 HiEV 表示," 周期性重寫代碼是對產(chǎn)品和系統(tǒng)認知提升后的必然階段。在工程化方面,該踩的坑基本都要踩一遍,大家都需要階段性更新代碼和架構(gòu)。"
從已有信息看,基于 BEV 研發(fā)全新算法,小鵬們的做法相似。大家均是從靜態(tài) BEV 網(wǎng)絡(luò)算法、動態(tài) BEV 網(wǎng)絡(luò)算法部署算法。
靜態(tài) BEV 解決的是道路結(jié)構(gòu)還原,感知對象是車道線、道路邊界、停止線,可以解決部分攝像頭被遮擋、車道線模糊等問題。
動態(tài) BEV 解決的是交通參與者的還原和預(yù)測,感知對象車輛位置、姿態(tài)、尺寸、速度,可以在車輛同時出現(xiàn)在多顆攝像頭視野內(nèi),可以穩(wěn)定地追蹤和感知出物體的距離和速度。
在 BEV 出現(xiàn)前,傳統(tǒng) 2D 檢測的好處是整個計算非常直觀,但整個投影過程都是使用軟件的方式,沒辦法形成端到端,會出現(xiàn)信息丟失、誤差等問題。
BEV 的到來,將讓小鵬們獲得更強的 360 度感知能力。
不過,這里面的難度并不小。
復雜的代碼,以及昂貴的數(shù)據(jù)標注
BEV,全稱Bird ’ s eye view,本質(zhì)上多個目標前融合感知方案。
簡單理解,它是將攝像頭等傳感器采集的 2D 為主的圖像數(shù)據(jù),轉(zhuǎn)化為 3D 坐標空間下的數(shù)據(jù),從而實現(xiàn)對物理世界的真實還原。
特斯拉的做法大致是:
基于純視覺,利用 8 個攝像頭采集數(shù)據(jù),通過深度學習的主干網(wǎng)絡(luò) Backbone 對各個攝像頭進行特征提取,再通過 Transformer 將 2D 圖像轉(zhuǎn)化為 3D 空間。
應(yīng)用的技術(shù)并不新潮。
Backbone 的本意是人的脊梁骨,在深度學習中被引申為主干網(wǎng)絡(luò)的意思,其主要作用是就是提取圖像的特征。
Transformer 最早在 2017 年由谷歌提出,是利用注意力機制(Attention)來提升模型訓練速度的模型。將 Transformer 發(fā)揚光大的是 GPT,也就是 Generative Pre-trained Transformer。
通過BEV 和 Transformer,特斯拉開始獲得全新的 " 上帝視角 " 下的數(shù)據(jù)。并在此基礎(chǔ)上為數(shù)據(jù)加上了時間戳,形成了 4D 空間。以用于對目標物測速,乃至對目標物的運動軌跡進行預(yù)測。
可以說,BEV 改進了自動駕駛看物理世界的視角,可以更高效、準確地獲取感知數(shù)據(jù),這為后面的規(guī)劃和控制提供了基石。
國內(nèi)的自動駕駛玩家已經(jīng)認可了這種方式,并且紛紛布局。
與特斯拉不同的是,國內(nèi)玩家之前的方案中,在攝像頭之外增加了更多的傳感器和定位系統(tǒng),比如超聲波雷達、激光雷達、高精度地圖等。
方法論相似,挑戰(zhàn)在于融合困難,以及更多的代碼量、數(shù)據(jù)標注工作。
寫代碼是一項繁重的任務(wù)。
小鵬汽車自動駕駛副總裁吳新宙披露,城市 NGP 的代碼量是高速 NGP 的 6 倍、感知模型數(shù)量是 4 倍、預(yù)測、規(guī)劃、控制相關(guān)代碼量是 88 倍。
為 BEV 的數(shù)據(jù)進行標注,同樣需要大量的工作。
舉個例子,要構(gòu)建實時語義地圖,需要對數(shù)據(jù)進行結(jié)構(gòu)性訓練,基于 BEV 模型做數(shù)據(jù)的標注、分割、分類。僅標注一項,根據(jù)毫末智行 CEO 顧維灝預(yù)測,BEV 的模型大概需要標注 1 億公里的數(shù)據(jù)。
智能駕駛數(shù)據(jù)服務(wù)商柏川方面告訴 HiEV,數(shù)據(jù)標注行業(yè)單人單月的綜合成本約為四千元,千人規(guī)模的標注團隊一年成本要達到 1 億元。
另一位從事數(shù)據(jù)標注的業(yè)內(nèi)人士向 HiEV 表示, " 要標注 1 億公里的數(shù)據(jù),實際上會有失效率,按照 50% 的失效率計算,假定都是簡單場景,每人每天標注 2km,需要一萬人的團隊標注至少四年的時間。 "
好在,特斯拉已經(jīng)探了路。
早前,特斯拉有一支千人規(guī)模的人工標注團隊,后來開始增加自動標注和虛擬仿真等工具。
對此,上述數(shù)據(jù)標注從業(yè)人士表示," 特斯拉的自動標注是行業(yè)風向標,其預(yù)標注技術(shù)目前行業(yè)最優(yōu)。加入自動化標注模型后,假定可以提效 80%,可以將 1 萬人團隊的標注時間縮減到一年。"
小鵬、毫末智行等已經(jīng)感受過人工標注的成本之昂貴,開始探索自動標注。其他各家,也可以進行借鑒。
BEV 帶來的變化:方案 " 減配 ",芯片合作更緊密
BEV 帶來的第一個變化,是讓自動駕駛配置開始縮減。
在沒有布局 BEV 之前,國內(nèi)車企是最早通過高精地圖來實現(xiàn)自身定位。車規(guī)級激光雷達成熟后,車企又加入了激光雷達。
布局 BEV 算法后,一些車企們開始由原來的堆砌配置,轉(zhuǎn)為縮減配置。
大家發(fā)現(xiàn),BEV 可以實時生成語義地圖,進而替代高精度地圖,甚至還可以去掉超聲波雷達。
事實上,小鵬早期并不打算去高精度地圖。
吳新宙曾提到,對于城市場景,高精地圖的鮮度非常關(guān)鍵,小鵬汽車正在和高德地圖一起努力,希望發(fā)布的時候能夠做到天級更新高精度地圖的能力。
不過,耗資幾千萬可以買下高速道路的高精度地圖,但要買下城市場景下的高精度地圖,費用又是另一個級別。
更何況,獲取地圖審批資質(zhì)的效率,也會耽誤自動駕駛向多個城市推送的進程。最終,車企們不得不進入自動駕駛的縱深地帶,利用技術(shù)甩掉高精度地圖的拐杖。
這里面也有一定挑戰(zhàn)。
"BEV 去高精度地圖,很多公司不一定能搞定,需要做大規(guī)模的云端場景重建、自動化的元素提取。另外,純拓撲的任務(wù)還是很難,很多時候會因為遮擋、車道線不清晰而難以實現(xiàn)。" 宏景智駕高級工程經(jīng)理柴可寧告訴 HiEV。
至于 BEV 是否會去掉激光雷達?
特斯拉的答案是, 利用 Occupancy 占用網(wǎng)絡(luò),以及 4D 毫米波雷達的點云信息,就能替代激光雷達。
國內(nèi)是另一重景象。
國內(nèi)目前尚未興起去激光雷達的苗頭。艾銳認為,激光雷達不會由于 BEV 算法的出現(xiàn)而被替代。
" 在夜間,攝像頭根本看不見。激光雷達是一個物理傳感器,可以主動發(fā)射信號。對高端車型來說,可以讓車輛多一重安全性。對于中低端產(chǎn)品來說,成本相對較高,只有追求極致性價比,才會去傳感器。" 他解釋道。
其實,基于純視覺還是多模態(tài),本質(zhì)上不是技術(shù)問題,而是一個商業(yè)成本問題。從技術(shù)角度,多模態(tài)的效果肯定更好,但從成本角度,多模態(tài)的上車搭載量會少。
BEV 帶來的第二個變化,是需要芯片廠商更好地適配,與車企形成深度合作。
因為,BEV 方案比較考驗芯片對于算子的支持能力。
除了特斯拉采用自研 FSD 芯片外,頭部自動駕駛玩家更多地 基于英偉達 Orin X 落地 BEV 方案,且以雙 Orin X 為主,算力高達 508TOPS。
對此,艾銳表示," 英偉達的芯片基礎(chǔ)計算單元是 CUDA,非常小,也非常靈活,對算子的支持能力非常強。"
而如果算力小了,要實現(xiàn)同樣的幀率,就需要做特別的算子優(yōu)化。
事實上,一套標準的 BEV 算法,現(xiàn)在的很多芯片都不支持,大家在用各種各樣的算子去替換它們,這就需要芯片廠商和主機廠深度配合。
今年 4 月,比亞迪在上海車展宣布基于地平線征程 5 的自研 BEV 方案將在年內(nèi)量產(chǎn)。目前,地平線可以向車企提供 BEV 參考算法,且正在布局 Occupancy 占用網(wǎng)絡(luò)。雙方的合作,將是基于征程 5 落地 BEV 的首個案例。
最后,BEV 技術(shù)的強大感知能力,不僅吸引了乘用車競相布局,也在商用車里面開始應(yīng)用。
比如,摯途科技的 BEV 方案,便針對商用車型車身長、檢測盲區(qū)較大的特點,向車企提供攝像頭選型和安裝位置方案,可以實現(xiàn)前方 300 米范圍的檢測,且增加了車身和近距離的感知冗余。
頭部車企闖關(guān) BEV 感知時,其他傳統(tǒng)車企會面臨更大的壓力。
后來者,自研還是外包?
對于 BEV 方案,發(fā)力較晚的車企其實有著更多選擇。
一種是自研。
要做 BEV 方案,方向大致已定。需要選一套傳感器方案,基于大算力芯片進行開發(fā)。另外,還需要自動標注閉環(huán)系統(tǒng),以及用于數(shù)據(jù)訓練的智算中心等等。
時間上,做 BEV 的周期相對造車更短。
" 主機廠從傳統(tǒng) 2D 檢測轉(zhuǎn)到 BEV 感知,如果要把數(shù)據(jù)準備都算上,快的話需要一年時間。" 艾銳說。
投入事項明確,周期相對較短,這決定了車企可以進行自研。
我們也注意到,除上述幾家布局 BEV 的車企外,其他玩家也在準備入局。
今年 1 月,長安汽車智算中心 GPU 算力擴容集成項目開始招標。2 月,吉利星睿智算中心在湖州長興揭牌。
另一種是與供應(yīng)商合作。
如果看整個國內(nèi)汽車市場,會發(fā)現(xiàn)自動駕駛方案供應(yīng)商也有其存在價值。
除了造車新勢力覆蓋的 30 萬以上的高端市場外,中低端市場十幾萬以上 30 萬以下的車,仍然是主流。
據(jù) HiEV 了解,毫末智行將基于十幾 TOPS 的芯片運行 BEV 算法," 硬件成本上,幾千塊錢就可以做到城市 NOA,類似的產(chǎn)品很快也會出現(xiàn)。"
一些之前布局 L4 的科技公司,比如小馬智行、元戎啟行、商湯絕影等,也在推出 BEV 的方案。這些公司做 BEV,優(yōu)勢在于之前的算法更易于遷移。
理論上,這些公司不會面臨華為向車企提供解決方案時的 " 奪走靈魂 " 的質(zhì)疑。
" 華為太大了,它有能力做任何事,包括造車。我們很小,而且非常開放,車企不需要擔心失去靈魂。" 一位自動駕駛解決方案供應(yīng)商的高管表示。
" 在 BEV 上,我們愿意賦能車廠,是服務(wù)者的心態(tài)。很多時候,車廠對我們感興趣的就是真值系統(tǒng),它一年有幾千萬的標注預(yù)算,搭載真值系統(tǒng)后,可以降到幾百萬,肯定會感興趣。整體上,車企對我們的感知算法很感興趣。" 柴可寧說。
" 從技術(shù)演進趨勢看,不是零和博弈。作為一個解決方案供應(yīng)商,我們的算法、云端中心還是有一定的領(lǐng)先性。" 商湯絕影量產(chǎn)行車智能駕駛研發(fā)負責人蔣沁宏表示。
如果車企不想重復造輪子,至少在可見的一段時間,與解決方案供應(yīng)商合作,盡早進入自動駕駛的賽道是一個好的選擇。
基于 BEV 的城市 NOA,年內(nèi)將落地百城
還記得 2020 年下半年,蔚來推出基于 Mobileye 的高速 NOP 功能,小鵬則基于英偉達 Xavier 推出了高速 NGP。
如今,三年時間不到,大家又開始比拼基于 BEV 感知架構(gòu)落地城市 NOA 的效率。
一個例子可以看出各家競爭的激烈。
最近,小鵬發(fā)布了一項名為 " 通勤模式 " 的功能,又被稱為微縮版城市 NGP,可以在無圖方案的四五線城市使用。
" 聽說我司預(yù)告城市通勤模式之后,有兩家友商已經(jīng)快速決策分別從宣傳和實際行動上致敬一下子。" 小鵬汽車自動駕駛產(chǎn)品高級總監(jiān)劉毅林在社交平臺上發(fā)文表示。
今年以來,各家陸續(xù)公布基于 BEV 的城市 NOA 落地計劃。
小鵬計劃今年下半年,將在大部分無圖城市開放變道、超車、左右轉(zhuǎn)能力;
蔚來已經(jīng)推送的 Banyan2.0.0 版本,切換為了 BEV 架構(gòu),下半年將推出帶有城區(qū)能力的 NAD Beta 版本;
理想的城市 NOA 將在第二季度內(nèi)開啟推送,并于年底前完成 100 個城市的落地推送;
其他玩家,毫末智行、華為、比亞迪,也將在今年落地 BEV 方案。
中國有 600 多個城市,按照各家計劃,年內(nèi)將有接近六分之一也就是近百家城市可以使用城市 NOA 功能。
對于這些大力投入的玩家來說,有的需要維護一早立起的自動駕駛一哥的江湖地位,有的蓄勢通過城市 NOA 規(guī)模落地打一個后來居上的漂亮翻身仗,也有的要證明自己在自動駕駛領(lǐng)域也是遙遙領(lǐng)先,也有的要借助車企,為更大的市場立一個標桿產(chǎn)品,一切都將在下半年出現(xiàn)定論。
各家競逐城市 NOA 落地時,還有一家真正的巨頭正在候場。目前,特斯拉 FSD Beta 已經(jīng)在海外城市范圍內(nèi)推送,進入國內(nèi)只是時間問題。
如王傳福所說,新能源汽車的上半場是電動化,下半場是智能化。
在電動化競爭階段,大家還有傳統(tǒng)造車工藝可供依仗,智能化的競爭階段,將是包括 BEV 感知、規(guī)劃、控制,以及智能座艙等在內(nèi)的各個點位的全方位競賽,更加考驗車企的軟件研發(fā)能力。經(jīng)歷 BEV 算法落地大戰(zhàn)后,車企的核心技術(shù)將再次重塑。
本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com

