職位描述
該職位還未進行加V認證,請仔細了解后再進行投遞!
Base地:北京望京SOHU或上海閔行莘莊
職責描述:
1. 負責基于強化學習(如Online/Offline RL、Model-based RL)的自動駕駛行為決策與運動規劃算法研發,重點解決結構化道路(高速、城市快速路)及非結構化場景(自動泊車)中的動態交互與博弈問題;
2. 針對復雜動態場景(密集車流、無保護路口、人車混流),設計基于數據驅動的決策規劃算法,通過大規模分布式訓練系統提升策略的智能性、安全性及泛化能力;
3. 構建與迭代仿真環境(如CARLA、NVIDIA Isaac)與世界模型,推動強化學習策略的仿真訓練與實車遷移(Sim2real),形成“真實數據→仿真訓練→實車驗證”的閉環優化;
4. 參與全棧自動駕駛決策控制系統的開發,對接感知、預測、端到端模塊,實現基于強化學習的決策規劃算法在車載平臺上的部署、性能優化與實車路測;
5. 跟蹤強化學習在自動駕駛領域的前沿進展(如大模型與RL結合、逆強化學習、多智能體博弈),進行技術預研與算法創新,推動研究成果在量產項目中的應用與落地。
任職要求:
1. 計算機科學、自動化、機器學習、機器人學等相關專業本科及以上學歷;
2. 具備扎實的強化學習理論基礎,熟悉主流RL算法(PPO、SAC、TD3、IQL等),并至少在一項自動駕駛或機器人項目中具有RL算法落地經驗;
3. 熟練掌握Python/C ,熟悉PyTorch等深度學習框架,具備大規模強化學習分布式訓練(如Ray、Kubernetes)或仿真平臺開發經驗者優先;
4. 熟悉自動駕駛決策規劃常見方法(如MDP/POMDP、搜索與優化算法),并能夠將強化學習與傳統規劃方法(如MPC、Lattice)結合解決實際問題;
5. 具備良好的數學基礎,熟悉優化理論、概率論、車輛動力學建模,能夠支撐RL算法中的獎勵函數設計、策略優化與安全約束處理。
加分項:
1. 在NeurIPS、ICLR、ICML、ICRA、CoRL等會議或期刊發表過強化學習相關論文;
2. 具備自動駕駛量產項目(如NOA、LCC)或L4級項目(Robotaxi、Robobus)中RL算法集成與調試經驗;
3. 熟悉仿生學習、逆強化學習、世界模型等技術,具備數據合成、評測基準構建或RL訓練基礎設施開發經驗;
4. 熟悉ROS、Apollo等自動駕駛框架,或具備CARLA、Isaac Gym等仿真工具鏈的使用和開發能力。
工作地點
地址:上海閔行區上海-閔行區旭輝·莘莊中心-1號樓上海閔行區旭輝莘莊中心1號樓6層
??
點擊查看地圖
詳細位置,可以參考上方地址信息
求職提示:用人單位發布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓費、身份證、畢業證等),均涉嫌違法,請求職者務必提高警惕。
職位發布者
孫先生HR
上海鈞正網絡科技有限公司
-
互聯網·電子商務
-
1000人以上
-
私營·民營企業
-
鼓樓街道

應屆畢業生
本科
2026-03-05 23:34:33
476人關注
注:聯系我時,請說是在四川人才網上看到的。
