智能化終局之戰(zhàn),極越下出勝負(fù)手
機(jī)器人何必是“人”?
在看完首屆極越AI DAY后,不少人都發(fā)出了這樣的感嘆。如果說內(nèi)燃機(jī)/電機(jī)驅(qū)動了汽車的肉體,AI則為汽車賦予了靈魂。
3月25日晚,在北京的百度總部,舞臺中央的極越汽車CEO夏一平自信的說道,“在智能汽車3.0時代,‘機(jī)器人化’將是發(fā)展趨勢,具備自然交流、自由移動、自我成長三種能力的汽車就是汽車機(jī)器人,才是真正意義上的‘AI CAR’。”
無獨有偶,在前不久的百人會上,也有資深業(yè)內(nèi)人士表達(dá)了類似觀點,稱“具車智能”大概率會發(fā)生在“具身智能”之前,“具車智能”也大概率會發(fā)生在中國的車企。他判斷,AI將會成為智能汽車的勝負(fù)手。
得益于百度AI大模型生態(tài)支持,目前極越01已經(jīng)深度融合文心一言、Apollo、百度地圖、小度等技術(shù)能力。極越01創(chuàng)造了全球范圍內(nèi)率先實現(xiàn)AI大模型“上車”、國內(nèi)唯一/全球唯二的純視覺高階智駕、首個OCC占用網(wǎng)絡(luò)升級、首個AI語音算法全量本地化等諸多行業(yè)領(lǐng)先。
當(dāng)晚,夏一平發(fā)布了OTA V1.4.0新版軟件,自動駕駛、LD地圖、人機(jī)交互領(lǐng)域的百度三項最新AI原生科技驚艷亮相。這表明,百度AI大模型生態(tài)正在深度賦能極越汽車機(jī)器人,加速其進(jìn)化。
顯而易見,作為行業(yè)首個舉辦汽車AI技術(shù)大會的玩家,極越無疑引爆了汽車界的AI之戰(zhàn)。
“今年,如果誰還沒有落地 ‘智駕全國都能開,誰就一定會在智能化浪潮中掉隊。”
在現(xiàn)場數(shù)百家媒體的見證下,夏一平宣布,2024年極越即將實現(xiàn)——只要百度地圖能導(dǎo)航的地方,就可以使用PPA智駕。
夏一平表示,基于百度Apollo純視覺高階智駕能力和安全體系賦能,極越完成了OCC占用網(wǎng)絡(luò)升級,已形成“B.O.T”完整技術(shù)體系。在本次AI DAY上,百度Apollo自動駕駛視覺大模型VTA(Vision Takes All)正式發(fā)布,大幅升級包括動靜態(tài)檢測、時序跟蹤、實時建圖、場景理解等能力。
升級后的OCC占用網(wǎng)絡(luò)感知能力大幅提升。在擁有比肩激光雷達(dá)的厘米級3D模型刻畫的基礎(chǔ)上,對障礙物的識別種類再度增加,不僅包括施工牌、圍欄、路障、防撞桶等單個靜態(tài)障礙物,而且對道路臨時施工的圍欄、靠邊??康墓收宪囕v、臨時堆放的大垃圾桶等障礙物也能精準(zhǔn)感知。
值得一提的是,V1.4.0版本新增OCC 3D地圖彩蛋,用戶可以通過車機(jī)屏幕清晰地看到汽車機(jī)器人眼中的世界。在現(xiàn)場演示中,屏幕里如同積木一樣不同顏色的方塊標(biāo)識出車外的障礙物/綠化帶/其他車輛等,還有卡通的3D人物標(biāo)識出過往的行人。
得益于OCC感知能力的提升,極越點到點領(lǐng)航輔助PPA也大幅升級,可以應(yīng)對更復(fù)雜的行車場景。夏一平舉例說,在路況復(fù)雜路口,前車轉(zhuǎn)彎太慢、電瓶車貼靠太近,PPA都能主動繞行。在突遇道路施工圍欄、路邊故障車輛、臨時堆放雜物等情況,PPA可以靈活繞開或及時剎停。針對很多用戶因為長實線或大車擋道而錯過高速匝道出口的問題,PPA也能合理規(guī)劃路線,找準(zhǔn)變道時機(jī)。
同時,V1.4.0版本還升級了一系列行車體驗優(yōu)化,如:新增自動轉(zhuǎn)向燈功能、新增PPA高速高架變道風(fēng)格設(shè)置、轉(zhuǎn)向自動圖像輔助新增盲區(qū)預(yù)警等,并優(yōu)化了前向碰撞預(yù)警FCW和自動緊急制動AEB之類的ADAS功能體驗。
智駕開城堪稱2023年智駕圈最激烈的戰(zhàn)爭,而到了今年,戰(zhàn)火依然繼續(xù)。當(dāng)晚,夏一平宣布,城市PPA又新開一城——廣州,這也是繼北京、上海、杭州、深圳之后的第5個城市。對于較為特殊的北京城市路段,PPA也進(jìn)一步完善,擴(kuò)大了覆蓋范圍,可全面覆蓋五環(huán)內(nèi)城區(qū)的主要道路。
在AI DAY上,百度副總裁尚國斌直言有些友商的全國可用是“文字游戲”,是PR式發(fā)布。號稱全國都能開,但其實很多城市只有幾條路可以開;有的只是LCC全國可用;還有的是期貨,落地遙遙無期。但極越PPA智駕的覆蓋里程即將超過50萬公里。2024年,基于百度Apollo、百度地圖的AI大模型能力賦能,PPA智駕“全國都能開、路路好體驗”的目標(biāo)指日可待。
夏一平和尚國斌之所以敢立下“只要百度地圖能導(dǎo)航到的地方就能用PPA智駕”的軍令狀,得益于百度的AI加持。與華為和小鵬等玩家的激光雷達(dá)方案不同,極越一開始走的就是更為艱難的純視覺路線。
百度智能駕駛事業(yè)群組首席研發(fā)架構(gòu)師、IDG技術(shù)委員會主席王亮認(rèn)為,一圖勝千言。激光雷達(dá)蘊(yùn)含的信息量,相比圖像(視覺)來說少好幾個量級。攝像頭的采樣密度是今天主流激光雷達(dá)的160倍,等接下來最好的激光雷達(dá)上市之后,攝像頭的密度仍然是它的20倍。激光雷達(dá)的優(yōu)勢在于可以很快上車,但依靠激光雷達(dá)肯定走不到智駕終局。
但如此復(fù)雜多樣的信息,如何才能讓模型具備通用泛化的能力?百度的解法是大模型 AI 原生理念。百度構(gòu)建了一個自動駕駛視覺大模型VTA(vision takes all)。大模型首先會對海量的駕駛場景進(jìn)行自監(jiān)督訓(xùn)練,讓大模型對世界有更多的基礎(chǔ)通用的理解,使其具備目標(biāo)檢測、實時建圖、時序跟蹤、場景理解的核心能力。然后,大模型會針對性地做出如景深識別等專業(yè)性的訓(xùn)練。
在大模型時代指導(dǎo)AI研發(fā)的一條規(guī)律就是OpenAI在2020年提出的Scaling Laws概念,中文譯成規(guī)模法則。規(guī)模法則里面很重要的一條是算力,多大算力決定你的模型能走多遠(yuǎn)。王亮透露,百度目前坐擁北京、蘇州、陽泉三大計算中心,僅投入到智駕的算力就累計達(dá)到了 2.2 EFLOPS,數(shù)據(jù)緩存高達(dá) 30PB,智駕有效訓(xùn)練時長占比 98%,百度對極越的算力投入并不設(shè)限。
當(dāng)然,極越PPA全國都能開肯定開離不開百度地圖的賦能。過去由于成本高昂,高精地圖讓業(yè)內(nèi)又愛又恨。在AI DAY上,尚國斌透露,僅是在廣州完成一次高精地圖的繪制,成本就上億。但百度LD地圖(LD即車道級導(dǎo)航)的出現(xiàn)扭轉(zhuǎn)了這一局面。LD地圖對傳統(tǒng)高精地圖地圖的要素、精度等最小化的要求,保留最必需的要素和精度;同時,增加了經(jīng)驗圖層、安全圖層、實時圖層等傳統(tǒng)高精地圖不具備的要素。
更重要的是,LD地圖徹底重構(gòu)了傳統(tǒng)的地圖生產(chǎn)模式,實現(xiàn)端到端地圖生成新范式,突破了車道級地圖規(guī)?;钠款i。據(jù)悉,百度向全國道路投放數(shù)百輛 L4 級別采集車,并通過大模型生成地圖,顛覆了過往99%人力生成地圖的生產(chǎn)方式。
尚國斌說,去年上半年,百度開城速度約為一季度一城市,到了第三季度,單季度就能開 30 座城市。而現(xiàn)在,百度的開城速度是過去的100倍,成本是過去的1/20,能夠做到一天開一城。目前,百度地圖已經(jīng)完成了全國360萬公里的道路生成,LD 地圖覆蓋360個地級市。
“LD地圖具備‘全國城市都能開’、‘手機(jī)/艙駕都能用’、‘智駕有圖才安全’三個特點,真正的全國360城全覆蓋,全球唯一將自動駕駛原生地圖應(yīng)用在手機(jī)和汽車上,讓智駕像人一樣開,比人更安全。”正是因為全面融合了百度地圖的核心能力,尚國斌才放言,“只要百度地圖導(dǎo)航能到的地方,極越01的PPA智駕就能用。”
除了智駕,極越汽車另一個黑科技就是無出其右的語音交互能力。其讓汽車機(jī)器人在與用戶的交互過程中更聰明、反應(yīng)更快,也更加像一個真正的人。
百度語音首席架構(gòu)師賈磊表示:“更超強(qiáng)的技術(shù)一定是端側(cè)大模型模型,讓車機(jī)在任何網(wǎng)絡(luò)環(huán)境下,都能快速響應(yīng)用戶交互需求并解答車輛相關(guān)操作的問題。”極越01憑借車載語音的“全域全端側(cè)”已經(jīng)將語音助手SIMO打造成了語音天花板,識別速度快至500ms??鋸埖恼f,其使用體驗無限接近鋼鐵俠的賈維斯。
官方信息顯示,SIMO從極越01交付第一天起,背后就得到了大模型能力的支持——百度文心一言,提供了車外語音控制、多模態(tài)融合交互、無網(wǎng)弱網(wǎng)全程在線、主駕駛免喚醒、車內(nèi)四人同時說等其它智能座艙產(chǎn)品不具備的功能。
在V1.4.0版本中,SIMO新增基于大模型的主動推薦和用車知識自由問答,支持音樂推薦、視頻信息問答、景點推薦和查詢、功能解答等功能。例如,在車上和朋友聊到某個電視劇情,但想不起其中細(xì)節(jié),便可通過詢問SIMO迅速找到該劇情并播放相應(yīng)劇集。
夏一平透露,目前SIMO的日均語音交互滲透率達(dá)98%,日均語音交互次數(shù)高達(dá)63次,是行業(yè)友商的10倍。其中,每車日均調(diào)用文心一言服務(wù)達(dá)7.1次,占日均語音交互次數(shù)比例約11%。自極越01上市5個月以來,通過SIMO收到了23,323個用戶反饋,每個問題都會以秒級效率對接給研發(fā)中心,24小時內(nèi)反饋用戶。
多媒體娛樂生態(tài)服務(wù)向來是用戶高頻次使用的功能。V1.4.0版本新增無線投屏應(yīng)用,支持投屏到車機(jī)端播放;新增車載Wi-Fi熱點,供車內(nèi)設(shè)備共享流量。同時,還上線了《全明星街球派對》、《小三角大英雄》游戲。
當(dāng)然,這些還不是智能交互的全部。夏一平預(yù)告,極越V2.0版本即將發(fā)布,屆時將升級全新的語音大模型、全國都能開的PPA智駕等重磅功能。
自1886年誕生到現(xiàn)在,汽車已經(jīng)經(jīng)歷了 100多年的發(fā)展。這100多年來,汽車革命經(jīng)歷過“燃油車1.0時代”和“電動車2.0時代”,而在當(dāng)下的“智能汽車3.0時代”,底層驅(qū)動力正是來自于AI大模型技術(shù)。
當(dāng)晚的AI DAY上,夏一平說,智能汽車3.0時代是汽車機(jī)器人的時代,時代變革起點是汽車“駕駛權(quán)”由人類向AI轉(zhuǎn)移。這無疑是一座難以逾越的高山。
但極越在AI DAY上展示的能力,讓外界看到了其正在越過這座關(guān)山,走向一個新世界。
>>點擊查看今日優(yōu)惠<<