自動駕駛面試必問的15個問題:感知+規劃+控制全鏈路覆蓋

面試專題作者: 美歷團隊

自動駕駛面試高頻15題:3D檢測/BEV感知/多傳感器融合、行為預測/運動規劃/Lattice Planner、MPC/PID控制、高精地圖/仿真測試,每題含考察點與答案方向

背景介紹

我之前一直在做傳統計算機視覺,去年開始轉自動駕駛方向,面了大概五六家做自動駕駛的公司,包括造車新勢力、傳統車企的自動駕駛部門、還有幾家做L4的創業公司。說實話,自動駕駛面試的覆蓋面真的很廣,從感知到規劃到控制,每個模塊都能單獨出一套面試題。我整理了15道高頻必問題,基本覆蓋了面試官最愛考的知識點,希望能幫到正在準備的同學。

面試流程復盤

自動駕駛崗位的面試流程一般是:簡歷篩選→技術一面(基礎+感知)→技術二面(規劃+控制)→技術三面(系統設計或項目深挖)→HR面。有個很明顯的特點,就是面試官會根據你的背景定向提問。比如你簡歷上寫了3D目標檢測,他就會從BEV感知一路問到多傳感器融合;如果你寫了規劃,他就會從行為預測問到運動規劃再到時空聯合優化。所以簡歷上寫的東西一定要能扛住深挖。我有個朋友在二面被問到"你做的3D檢測在夜間場景下性能下降多少,怎麼解決的",他沒準備這個,直接卡殼了。

真題匯總

一、感知(5題)

1. 3D目標檢測的主流方法有哪些?PointPillars和CenterPoint的區別?

考察點:理解3D檢測的技術路線和代表性方法。

答案方向:3D檢測主要分點雲方法多模態方法。點雲方法又分基於體素的(PointPillars、VoxelNet)和基於點的(PointNet++、CenterPoint)。PointPillars將點雲劃分為柱狀體素(pillar),用PointNet提取特徵後展開為偽圖像,再用2D檢測頭。優點是速度快,適合實時部署。CenterPoint先用骨幹網絡提取BEV特徵,再用CenterHead預測目標中心點和其他屬性,通過關鍵點熱力圖做檢測。CenterPoint的優勢是不需要NMS(因為中心點是唯一的),精度更高,但速度稍慢。實際部署中PointPillars更常用,CenterPoint在學術benchmark上更優。

2. BEV感知是什麼?為什麼是當前主流方案?

考察點:理解BEV(鳥瞰圖)感知的動機和優勢。

答案方向:BEV感知是將多相機圖像轉換到統一的鳥瞰圖空間進行感知。成為主流的原因:統一表示,多相機特徵在BEV空間自然對齊,無需後融合;適合下游任務,規劃和控制都在BEV空間工作,感知結果直接可用;時序融合方便,BEV空間下不同時刻的特徵對齊簡單。主流方案分基於LSS的(Lift-Splat-Shoot,顯式預測深度分佈做3D投影)和基於Transformer的(BEVFormer,用交叉注意力做特徵查詢)。BEVFormer精度更高但計算量大,LSS系列更輕量。特斯拉的Occupancy Network也是BEV感知的延伸。

3. 多傳感器融合有哪些方式?前融合和後融合的區別?

考察點:理解傳感器融合的策略和選擇。

答案方向:融合方式按層次分:前融合(數據級),原始數據直接融合,信息保留最完整但對齊要求高;特徵融合,各傳感器提取特徵後在中間層融合,是當前主流方案;後融合(目標級),各傳感器獨立檢測後融合結果,實現簡單但信息損失大。按時間分:早融合(輸入時融合)和晚融合(輸出時融合)。當前趨勢是特徵級融合,如BEVFusion將LiDAR點雲和相機圖像在BEV特徵空間融合。前融合信息量最大但對標定和同步要求極高,後融合最簡單但丟失了互補信息。

4. 車道線檢測怎麼做?有哪些挑戰?

考察點:理解車道線檢測的方法和難點。

答案方向:車道線檢測方法:分割方法(將車道線像素分割出來,如SCNN);檢測方法(直接回歸車道線參數,如PolyLaneNet);Anchor-based方法(如LineCNN用行錨點檢測);Transformer方法(如CLRNet用交叉注意力精修車道線)。主要挑戰:遮擋(前車遮擋、彎道遮擋);磨損(老舊車道線不清晰);複雜拓撲(分合流、交叉路口);光照變化(逆光、夜間、雨雪)。當前工業界更傾向於用參數化表示(如三次多項式或貝塞爾曲線)來建模車道線,比像素級分割更魯棒。

5. 多目標跟蹤(MOT)的主流方法?

考察點:理解目標跟蹤的技術路線。

答案方向:MOT分基於檢測的跟蹤(DBT)聯合檢測跟蹤(JDT)。DBT是先檢測再關聯,代表方法有SORT/DeepSORT(用卡爾曼濾波+匈牙利算法做數據關聯)。JDT是檢測和跟蹤端到端做,代表方法有TrackFormer、MOTR(用DETR架構做聯合檢測跟蹤)。當前自動駕駛中DBT仍是主流,因為工程上更可控。關聯算法的核心是特徵匹配(外觀特徵+運動特徵),DeepSORT用ReID特徵做外觀匹配,ByteTrack用檢測分數做分層關聯。3D MOT還需要考慮3D位置和速度信息做關聯。

二、規劃(5題)

6. 行為預測怎麼做?有哪些不確定性?

考察點:理解軌跡預測的方法和不確定性建模。

答案方向:行為預測分確定性預測概率性預測。確定性預測輸出一條軌跡,概率性預測輸出多條可能軌跡(多模態)。主流方法:編碼-交互-解碼框架,先用向量編碼器提取道路和Agent特徵,再用交互模塊建模Agent間關係,最後用解碼器生成軌跡。代表方法:MultiPath(錨點+偏移)、CoverNet(覆蓋集合)、MotionFormer(Transformer架構)。不確定性來源:認知不確定性(模型自身的不確定性,可通過集成估計)和偶然不確定性(環境本身的隨機性,如行人意圖不可預測)。工業界常用多模態預測(輸出top-K條軌跡及概率)來應對不確定性。

7. 運動規劃的方法有哪些?怎麼處理動態障礙物?

考察點:理解運動規劃的核心算法和動態場景處理。

答案方向:運動規劃分搜索方法(A*、Hybrid A*)和優化方法(二次規劃、非線性優化)。搜索方法在配置空間中搜索路徑,適合有複雜約束的場景;優化方法在初始解附近迭代優化,速度快但依賴初始解。處理動態障礙物:時空規劃(在x-y-t三維空間規劃,同時考慮空間和時間);預測+規劃(先預測動態障礙物軌跡,再在預測結果上規劃);交互規劃(考慮自車行為對他車的影響,做博弈論規劃)。工業界常用分層架構:行為規劃(決策)→運動規劃(軌跡生成)→控制(跟蹤)。

8. Lattice Planner的原理是什麼?

考察點:理解Lattice Planner的工作機制。

答案方向:Lattice Planner的核心思想是在終點空間採樣,生成一組候選終點,對每個終點用多項式(通常五次多項式)連接起點和終點生成候選軌跡,然後對候選軌跡做代價評估(考慮舒適性、安全性、效率等),選擇代價最小的軌跡。Lattice Planner的優點:實時性好(採樣+評估的計算量可控);可解釋性強(代價函數的權重可以調);容易加入約束(直接在代價函數中加懲罰項)。缺點:採樣密度和計算量的矛盾(採樣太稀疏可能錯過好軌跡,太密集計算量大);對終點空間的設計敏感(終點採樣策略直接影響規劃質量)。

9. 決策樹在自動駕駛中怎麼用?

考察點:理解行為決策的方法。

答案方向:決策樹在自動駕駛中用於行為決策層,決定自車應該執行什麼行為(跟車、變道、讓行等)。實現方式:規則決策樹(基於專家經驗構建if-else規則,簡單但難以覆蓋所有場景);POMDP(部分可觀測馬爾可夫決策過程,可以建模不確定性,但計算複雜度高);強化學習(端到端學習決策策略,泛化性好但安全性難保證)。工業界目前以規則+狀態機為主,輔以少量學習方法。規則決策樹的核心挑戰是場景覆蓋規則衝突,需要大量的測試和迭代來完善規則庫。

10. 時空聯合規劃是什麼?比分離式規劃好在哪裡?

考察點:理解時空聯合優化的優勢。

答案方向:傳統分離式規劃是先做路徑規劃(s-l空間),再做速度規劃(s-t空間),兩步解耦。時空聯合規劃是在x-y-t三維空間同時優化路徑和速度。聯合規劃的優勢:更優解(分離式規劃的兩個子問題可能都不是全局最優,聯合規劃可以找到更好的解);處理動態場景更自然(動態障礙物在時空空間中是"障礙柱",聯合規劃可以自然繞開);更平滑(路徑和速度同時優化,軌跡更平滑舒適)。劣勢:計算量大(三維優化空間比二維大很多);求解更難(非凸優化問題更複雜)。實際中常用粗規劃+精優化的策略:先用搜索方法在時空空間找粗解,再用優化方法精修。

三、控制(3題)

11. MPC在自動駕駛中怎麼用?和PID的區別?

考察點:理解模型預測控制的原理和優勢。

答案方向:MPC的核心思想是在每個時刻求解一個有限時域內的最優控制問題,只執行第一步控制量,然後滾動優化。MPC的優勢:可以處理約束(速度約束、加速度約束、道路邊界約束等);可以預測未來(基於模型預測未來狀態,提前規劃控制動作);可以優化多目標(舒適性、安全性、跟蹤精度等加權優化)。和PID的區別:PID是反饋控制,只看當前誤差;MPC是預測控制,看未來時域內的誤差。MPC更智能但計算量更大,PID更簡單但無法處理約束。自動駕駛中縱向控制常用MPC(處理跟車距離約束),橫向控制MPC和PID都有

12. PID控制的參數怎麼調?有什麼技巧?

考察點:理解PID調參的實踐經驗。

答案方向:PID調參的基本順序:先調P(比例增益,增大P使響應變快但可能振蕩);再調D(微分增益,增大D抑制振蕩但可能放大噪聲);最後調I(積分增益,消除穩態誤差但可能引起超調)。實用技巧:增量式調參(每次只調一個參數,觀察效果);頻域分析(用Bode圖分析穩定裕度);自適應PID(不同速度/曲率下用不同參數,查表法);抗積分飽和(加積分限幅防止windup)。自動駕駛中PID調參的難點是不同工況需要不同參數,高速和低速、直道和彎道的最優參數差異很大,通常需要做參數調度。

13. 軌跡跟蹤的誤差來源有哪些?怎麼減小?

考察點:理解軌跡跟蹤的精度問題和改進方法。

答案方向:誤差來源:模型誤差(車輛動力學模型不精確,如輪胎側偏剛度估計不準);延遲誤差(傳感器延遲、計算延遲、執行器延遲,總延遲可達100-200ms);離散化誤差(規劃軌跡是連續的,控制是離散執行的);干擾(路面坡度、風力、載荷變化等)。減小誤差的方法:延遲補償(在控制計算時預測延遲時間後的車輛狀態作為當前狀態);模型改進(用更精確的車輛模型,如考慮輪胎非線性的模型);前饋控制(根據參考軌跡的曲率計算前饋轉向角,減少跟蹤誤差);自適應控制(在線估計模型參數,實時調整控制器)。

四、系統(2題)

14. 高精地圖在自動駕駛中的作用?無圖方案可行嗎?

考察點:理解高精地圖的價值和去圖化趨勢。

答案方向:高精地圖提供先驗環境信息:車道級拓撲、道路幾何、交通標誌位置等,作用是降低感知負擔、提供超視距信息、輔助定位。高精地圖的問題:鮮度維護(道路變化後地圖需要及時更新,成本極高);覆蓋範圍(只覆蓋已採集區域,無法開城即用);法規風險(測繪資質限制)。無圖方案的思路:在線建圖(用車端傳感器實時構建局部高精地圖,如StreamMapNet);端到端(跳過地圖直接從感知到規劃,如特斯拉的方案)。目前行業趨勢是"輕地圖"方案:保留地圖的拓撲信息,去掉幾何細節,用車端感知補充。完全無圖在L2+可行,L4還需要地圖輔助。

15. 自動駕駛仿真測試怎麼做?有哪些指標?

考察點:理解仿真測試的方法和評估體系。

答案方向:仿真測試分軟件在環(SIL)硬件在環(HIL)車輛在環(VIL)。SIL最輕量,純軟件仿真;HIL接入真實ECU,測試軟硬件集成;VIL在封閉場地用真實車輛+虛擬場景。仿真平台:CARLA(開源,學術常用)、VTD、PreScan、Waymo的Simulation City。關鍵指標:碰撞率(最基本的安全指標);通過率(場景完成的百分比);舒適性指標(加速度jerk、橫向加速度等);效率指標(到達時間、通行效率)。仿真的核心挑戰是仿真到現實的gap(Sim2Real Gap),傳感器模型、環境模型、車輛模型的不精確都會導致仿真結果和真實表現不一致。

心得建議

自動駕駛面試最大的特點是系統性很強。你不僅要懂自己做的模塊,還要理解上下游模塊怎麼配合。比如做感知的,面試官會問"你的檢測結果怎麼給規劃用,格式是什麼,延遲要求多少";做規劃的,會問"感知結果有誤檢你怎麼處理"。所以準備面試時一定要有全鏈路思維

第二個建議是項目細節要能扛住追問。面試官特別愛問"為什麼選這個方案而不是那個方案","這個模塊的性能瓶頸在哪,怎麼優化的"。如果你只是調了個API,說不清原理,很容易被問住。

第三個建議是關注行業動態。自動駕駛技術迭代很快,BEV感知、端到端、Occupancy Network這些新技術面試官很愛問。建議面試前看看最近半年各大公司的技術博客和論文。

FAQ

Q:自動駕駛面試需要會C++嗎?

A:基本必須。自動駕駛的工程實現幾乎都是C++,面試中可能會讓你手寫簡單的算法實現。Python也要會,用於數據處理和模型訓練。

Q:沒有自動駕駛經驗怎麼轉行?

A:可以從自己原有方向切入。做CV的轉感知,做優化的轉規劃,做控制的直接對口。關鍵是補齊領域知識,比如做感知的要學3D視覺和點雲處理。

Q:面試被問到不熟悉的模塊怎麼辦?

A:誠實說這個模塊我了解不深,但可以說說自己的理解。面試官更看重你能不能快速理解新領域,而不是什麼都懂。

Q:需要看哪些論文?

A:感知:PointPillars、CenterPoint、BEVFormer、BEVFusion。規劃:MultiPath、CoverNet、MotionFormer。控制:MPC相關教材。系統:CARLA仿真相關。每個方向至少看3-5篇代表性論文。

Q:端到端自動駕駛會取代模塊化方案嗎?

A:短期內不會。端到端在L2+場景有進展(如特斯拉),但L4的安全性和可解釋性要求使得模塊化方案仍是主流。未來可能是模塊化+端到端的混合方案。

#自動驾驶#BEV感知#3D检測#运動規劃#MPC#高精地图#面試八股文#感知融合