6月9日消息,在2024中國汽車重慶論壇上,理想汽車董事長李想發(fā)表了演講。
李想表示:我今天分享我們在過去半年多的時(shí)間做的一個(gè)重要技術(shù)的突破,是關(guān)于自動(dòng)駕駛的技術(shù)的突破。
自己研發(fā)自動(dòng)駕駛時(shí),還有一個(gè)靈感來自妻子,曾經(jīng)妻子開車總是在剮蹭,無論比較大的寶馬X6還是比較靈活的高爾夫GTI。
于是他給妻子報(bào)名了寶馬駕駛學(xué)院的初級(jí)班,經(jīng)過一天的訓(xùn)練就不再剮蹭了。
寶馬培訓(xùn)班交了兩個(gè)事情:一是教你看路的能力,二是教你剎車的能力,只經(jīng)過這么一天的訓(xùn)練,我愛人就徹底和刮蹭告別了。
在接下來的十幾年里,沒有出現(xiàn)過任何的刮蹭,所以這是人類學(xué)習(xí)的一個(gè)方式。
他們在考慮如何把這樣能力給到車上時(shí),就看到了一個(gè)很重要的技術(shù)——VLM的視覺語言模型。
但是大模型因?yàn)轶w積太大,且有云端響應(yīng)時(shí)間較長的風(fēng)險(xiǎn),如何把一個(gè)視覺大語言模型進(jìn)行足夠壓縮,后放到車上去,是他們團(tuán)隊(duì)的重點(diǎn)任務(wù)。
視覺語言模型能夠在面對一個(gè)沒有紅綠燈的左轉(zhuǎn)路口提前作出預(yù)判,來知道我這個(gè)路口如何進(jìn)行特殊的處理、進(jìn)行復(fù)雜的處理,它還有另外一個(gè)重要的功能,就是告別高清地圖。
因?yàn)橐曈X語言模型能夠像人類一樣去讀懂導(dǎo)航地圖,導(dǎo)航地圖的橫向、縱向、速度、時(shí)間,包含紅綠燈,哪怕有車輛遮擋紅綠燈,也不會(huì)再成為問題。
巧合的是,理想的AD Max車型有兩顆Orin-X芯片,其中一顆芯片可以運(yùn)行一個(gè)壓縮到20億規(guī)模的VLM模型。
經(jīng)過驗(yàn)證,實(shí)際效果非常令人興奮,理想認(rèn)為,早在今年年底、晚在明年上半年,理想汽車有監(jiān)督的L3級(jí)自動(dòng)駕駛,就能批量向用戶交付。
本文鏈接:http://morphism.cn/news3485.html李想:理想自動(dòng)駕駛的研發(fā)靈感 有一個(gè)是來自妻子