李想沒亮相的這場發(fā)布會,卻展示了其硬核實(shí)力。
隨著特斯拉FSD(完全自動駕駛)進(jìn)入中國市場的步伐加快,各大車企紛紛跟進(jìn),推出自己的端到端大模型方案。
6月,理想汽車董事長兼CEO李想在2024中國汽車重慶論壇上表示,理想汽車將在今年三季度推出無圖NOA(自動輔助導(dǎo)航駕駛),早今年年底晚明年年初,推出基于理想自研大模型和VLM視覺模型的L3級自動駕駛系統(tǒng)。同時,隨著這套技術(shù)的演進(jìn)、算力的增強(qiáng)、模型的加大,無監(jiān)督的L4級別自動駕駛至少三年內(nèi)一定可以實(shí)現(xiàn)。
7月5日,理想汽車舉辦了理想 2024 智能駕駛夏季發(fā)布會。這次發(fā)布會李想并沒有出席,而是由三位技術(shù)專家介紹了理想智能駕駛的現(xiàn)在和未來。
在發(fā)布會上,他們以對話的形式,介紹了新的端到端+VLM雙系統(tǒng)智能駕駛模型,通過世界模型的學(xué)習(xí)和思考環(huán)境,這一系統(tǒng)將加速自動駕駛技術(shù)的迭代。
首批推送OTA 6.0版本的,是AD Max用戶 | 圖片來源:理想汽車
同時,理想推出的OTA 6.0版本智能駕駛升級,將引入無需高清地圖的NOA功能,并覆蓋理想MEGA和理想L9、L8、L7、L6的AD Max車型,惠及超過24萬名用戶,實(shí)現(xiàn)全國范圍內(nèi)的智能駕駛體驗(yàn)。
目前,多家廠商都在追逐「端到端」,但理想汽車是首個公開技術(shù)方案的車企。那么,理想的「端到端」方案到底有何特殊之處呢?
「緊跟」特斯拉
作為自動駕駛行業(yè)的標(biāo)桿企業(yè),特斯拉的技術(shù)路線一直備受關(guān)注。自2023年5月, 伊隆·馬斯克首次公開提到「特斯拉FSD v12是一個端到端AI」,到2024年3月,特斯拉開始大規(guī)模推送v12版本,特斯拉的端到端技術(shù)不斷進(jìn)步的過程,也見證了中國自動駕駛行業(yè)逐漸達(dá)成共識的歷程。
盡管行業(yè)內(nèi)對端到端的發(fā)展趨勢已形成普遍共識,但在具體技術(shù)路線上的分歧仍然存在。例如,「模塊化端到端」采用監(jiān)督學(xué)習(xí)的訓(xùn)練方式,而「單模型端到端」可能更傾向于自回歸和生成式的訓(xùn)練方法。
理想這次公布的自動駕駛方案,有點(diǎn)類似Momenta的雙系統(tǒng)模式。其理論來源是諾貝爾經(jīng)濟(jì)學(xué)獎得主丹尼爾·卡尼曼的《思考,快與慢》理論,提到了認(rèn)知心理學(xué)里系統(tǒng) 1 與系統(tǒng) 2 的概念。其中,系統(tǒng) 1 是基于人們過去的經(jīng)驗(yàn)和習(xí)慣形成的直覺,能夠迅速做出決策。系統(tǒng) 2 則代表著思維推理的能力,面對復(fù)雜問題和未知場景,人們需要思考、推理來解決??傊?,系統(tǒng) 1 和系統(tǒng) 2 相互協(xié)作,構(gòu)成了人類認(rèn)知和理解世界以及做出決策的基石。
理想自動駕駛系統(tǒng) 1 的演進(jìn)路徑 | 圖片來源:理想
具體到理想汽車的自動駕駛技術(shù)架構(gòu),主要靠三個部分來實(shí)現(xiàn):系統(tǒng) 1 由端到端模型(E2E)實(shí)現(xiàn),主要用于快速響應(yīng)常規(guī)駕駛問題。這個系統(tǒng)經(jīng)歷了三個階段:
模塊化設(shè)計,包含感知、定位、規(guī)劃、導(dǎo)航、NPN,支持了 100 個城市的 NOA。無圖模式。只有感知和規(guī)劃兩個模型,大的變化是去掉了NPN,不依賴于先驗(yàn)信息類似特斯拉的 One Model的端到端模型,只有一個模型,輸入的是傳感器,輸出的是行駛軌跡。
理想智能駕駛系統(tǒng)2的技術(shù)架構(gòu)圖 | 圖片來源:理想
系統(tǒng)2是視覺語言模型(VLM),具備處理復(fù)雜場景的能力。它由Transformer模型組成,將提示詞(Prompt)文本進(jìn)行分詞編碼,并將攝像頭圖像和導(dǎo)航地圖信息一起傳輸給模型進(jìn)行自回歸推理。系統(tǒng)2的輸出包括環(huán)境理解、駕駛決策和駕駛軌跡,然后傳遞給系統(tǒng)1來控制車輛。
與大多數(shù)單幀的VLM模型不同,理想設(shè)計了流式視頻編碼器,能夠緩存更長時間的視覺信息。此外,系統(tǒng)還增加了記憶模塊(Memory bank),可以緩存多幀歷史信息,從而解決長時間序列推理時延的問題。
可以這樣理解,系統(tǒng)2就像是一位智能導(dǎo)航和決策專家,它不僅能夠看到當(dāng)前的路況和環(huán)境(攝像頭圖像),還能夠根據(jù)地圖信息和用戶的指令(Prompt文本)來進(jìn)行決策和規(guī)劃行車路徑。
與此同時,理想汽車介紹了端到端方案的測試和驗(yàn)證方法。一般來說,業(yè)內(nèi)主流的做法是通過3D虛擬環(huán)境、重建仿真、生成仿真等進(jìn)行仿真測試。理想則結(jié)合了重建仿真和生成仿真兩種技術(shù)路徑。
可以用一個比方來說明:假設(shè)你在準(zhǔn)備考試,有兩種題型需要練習(xí):真題和模擬題。真題是過去考試中實(shí)際出現(xiàn)過的問題,模擬題則是根據(jù)考試大綱編寫的新題目。真題可以讓你熟悉考試的風(fēng)格和類型,而模擬題可以幫助你應(yīng)對可能出現(xiàn)的新情況。
理想的測試方法類似于這個準(zhǔn)備過程。他們先使用3D高斯濺射(3DGS)技術(shù),像是真題一樣重建真實(shí)場景,然后利用生成模型,像是模擬題一樣補(bǔ)充新的視角。這樣一來,他們創(chuàng)建的測試環(huán)境既真實(shí)又多樣,可以更全面地評估自動駕駛系統(tǒng)的表現(xiàn)。
此外,他們采用了動靜態(tài)分離的策略,就像是分開練習(xí)不同類型的題目:靜態(tài)部分是環(huán)境重建,動態(tài)部分則是對動態(tài)物體進(jìn)行重建和生成新視角。通過這種方法,他們創(chuàng)建了一個360°可編輯的3D物理世界,能夠模擬各種不同的駕駛條件,比如天氣變化、時間不同、車流量等,來全面測試自動駕駛系統(tǒng)的適應(yīng)能力。
開城大戰(zhàn)繼續(xù)玩下去
除了自動駕駛新架構(gòu),理想汽車還發(fā)布OTA 6.0版本的智能駕駛升級,帶來無需高清地圖支持的NOA功能。這次升級將覆蓋理想MEGA以及理想L9、L8、L7、L6的ADMax車型,惠及理想超過24萬名用戶。
在2023年,中國智能駕駛行業(yè)的焦點(diǎn)集中在「城市NOA開城大戰(zhàn)」。目前,華為和小鵬已經(jīng)推出了無需高清地圖的高階駕駛輔助功能,蔚來也推出了全域領(lǐng)航輔助NOP+城區(qū)功能。
理想無圖NOA的推送節(jié)奏 | 圖片來源:理想汽車
這次,理想也緊隨其后。據(jù)了解,理想汽車新發(fā)布的無圖NOA(導(dǎo)航輔助駕駛)功能不僅可以在城市和城鎮(zhèn)中行駛,還能適應(yīng)二級道路。相比之前的版本,新版無圖NOA在BEV(鳥瞰視圖)、感知能力、規(guī)控能力以及整體系統(tǒng)能力上都有了全面提升,能夠應(yīng)對更多復(fù)雜的行駛環(huán)境。
發(fā)布會上,理想汽車拆解了無圖NOA的四大核心能力,其中值得關(guān)注的是前兩個:
哪里都能開。無圖NOA無需依賴大量的「先驗(yàn)信息」。理想汽車的智能駕駛系統(tǒng)中有許多「小機(jī)器人」在運(yùn)行,雖然部分「小機(jī)器人」可能仍需一些先驗(yàn)信息,但整體能力的提升,使得系統(tǒng)能夠更靈活地應(yīng)對各種路面情況,而無需事先驗(yàn)證。繞行絲滑。該能力結(jié)合了時間和空間的雙重規(guī)劃。在實(shí)際駕駛中,常常會遇到車輛或行人阻礙通行。這時,「繞行順暢」能力就顯得尤為重要。其背后的時空聯(lián)合能力,可以同步規(guī)劃橫縱(前后左右)的空間,并持續(xù)預(yù)測自車與他車之間的空間交互關(guān)系。通過規(guī)劃出「未來一段時間內(nèi)」的所有可行駛軌跡,篩選出優(yōu)、高效的行駛路徑。
除此之外,理想汽車還對AEB(自動緊急制動)和AES(自動緊急轉(zhuǎn)向)進(jìn)行了多項(xiàng)優(yōu)化。在日常生活中的低速場景,特別是在地庫停車等復(fù)雜環(huán)境中,用戶可能會遇到柱子、墩子等障礙物。理想汽車的低速AEB能夠在這些情況下自動剎停,避免剮蹭,減少用戶的煩惱。
在高速行駛時,如果前車突然急剎并避讓,而當(dāng)前的車與前車距離過近,無法及時剎停,理想汽車的AES功能會自動減速并緊急轉(zhuǎn)向避讓。這個功能在“消失的前車”場景中尤其重要,可以顯著提升行車安全。
目前,端到端自動駕駛已經(jīng)成為行業(yè)的共識。華為、小鵬、元戎啟行、商湯絕影、零一汽車等主機(jī)廠和智能駕駛技術(shù)公司紛紛進(jìn)入這一領(lǐng)域,并在近半年陸續(xù)披露了上車量產(chǎn)規(guī)劃。
然而,端到端技術(shù)不是一項(xiàng)「一招鮮」的技術(shù),它需要一整套支持系統(tǒng)才能真正發(fā)揮作用。以特斯拉為例,雖然其他公司也在使用端到端技術(shù),但效果卻不如特斯拉理想。
特斯拉的成功不僅是因?yàn)椴捎昧硕说蕉?,還因?yàn)樗麄冊诿總€細(xì)節(jié)上都做得非常出色。不過,對在智能駕駛上的布局雖然相對較晚的理想汽車,端到端還是讓它有了追趕的機(jī)會。
本文鏈接:http://morphism.cn/news3931.html被吐槽沒技術(shù)的理想 要為自己正名