撰文 / 劉寶華
設(shè)計(jì) / 師 超
“車越來越聰明,也同質(zhì)化到不可思議?!?/p>
“中控大屏發(fā)展見頂,語音與多模態(tài)交互越來越重要。差異化硬件布局與動態(tài)氛圍打造獨(dú)特座艙DNA,將是2025年一個(gè)重要的競爭點(diǎn)?!?/p>
“2025年將會是大模型真正的元年,會進(jìn)入白熱化?!?/p>
“所謂真正的聰不聰明,應(yīng)該是感知、認(rèn)知、行動、反饋和進(jìn)化這五個(gè)維度的綜合評價(jià)?!?/p>
中國智能電動汽車在經(jīng)歷了堆料式的野蠻生長后,正在同質(zhì)化的價(jià)格戰(zhàn)下尋找成本與體驗(yàn)間的微妙平衡。
當(dāng)下,智能座艙發(fā)展也需要找到這樣一個(gè)平衡點(diǎn)。
12月13日,同濟(jì)大學(xué)汽車學(xué)院、設(shè)計(jì)創(chuàng)意學(xué)院雙聘教授、XAI智能體驗(yàn)實(shí)驗(yàn)室與人車關(guān)系實(shí)驗(yàn)室創(chuàng)始人馬鈞教授,在第十二屆軒轅獎(jiǎng)?lì)C獎(jiǎng)典禮上發(fā)表了題為《智艙脈動——2024年度總結(jié)與展望》的演講。他指出,智能座艙的發(fā)展進(jìn)步顯著,汽車的智能化程度不斷提升,車輛變得越來越“聰明”。然而,當(dāng)前智能座艙的設(shè)計(jì)和功能出現(xiàn)了明顯的同質(zhì)化趨勢,令人感到不可思議。
他的判斷,中控大屏發(fā)展見頂,語音與多模態(tài)交互越來越重要,如何打造獨(dú)特的智能座艙DNA,將是明年重要的一個(gè)競爭點(diǎn)。
以下為馬鈞教授演講實(shí)錄,有刪改。
車越來越聰明,也同質(zhì)化到不可思議
智能座艙的發(fā)展形式是不是一片大好,下一步的機(jī)會到底在哪里?
我自己有兩個(gè)實(shí)驗(yàn)室,一個(gè)是人車關(guān)系實(shí)驗(yàn)室,專門做HMI評測,一個(gè)是XAI-Lab智能體驗(yàn)實(shí)驗(yàn)室,主要做人工智能,大模型上車是今年我們最重要的一個(gè)研究方向。
在今年的軒轅獎(jiǎng)年度測評中,我們與《汽車商業(yè)評論》及眾多來自各地的專家一起,在襄陽對40款車型進(jìn)行了集中評測。聚焦于大模型技術(shù)的應(yīng)用,我們驚訝地發(fā)現(xiàn)已有22款車型搭載了大模型,這一進(jìn)展遠(yuǎn)超我們的預(yù)期。回顧去年年底,當(dāng)我們討論這一話題時(shí),市場上僅有少數(shù)幾款車型應(yīng)用了這一技術(shù),而今年的發(fā)展速度之快令人印象深刻。
先看看我們的座艙表現(xiàn)如何。
這里面有兩句話,一個(gè)是“是的”一個(gè)是“不對”,怎么思考?
專家,同時(shí)也是用戶,2025年也好,2024年也好,智能座艙已經(jīng)發(fā)展成我們想要的樣子了嗎?我們的預(yù)測到底是怎樣的?
根據(jù)測試,我們發(fā)現(xiàn)2024年真是車越來越聰明,當(dāng)然這個(gè)“聰明”肯定是用情商和智商的角度去思考的。但同時(shí),我們覺得現(xiàn)在同質(zhì)化真的嚴(yán)重到不可思議的程度。
這個(gè)大屏是5款車的5個(gè)UI拼接而成的,尺寸一樣、色彩一樣、UI一樣、交互一樣,已經(jīng)到了同質(zhì)化的時(shí)代。
我一直很想做一件事情,明年的測試,上車前把大家眼睛蒙起來,進(jìn)入車以后,把車的logo蒙上,然后讓大家再去試。
第一步看你是否能叫出它的名字。第二步是你能否與它順暢互動、成功喚醒它。只有在這個(gè)基礎(chǔ)上,我們才能真正評估產(chǎn)品的表現(xiàn):它是否真正理解你?它真的“聰明”嗎?還是僅僅在同質(zhì)化的競爭中趨同?
我一直呼吁大屏不應(yīng)成為趨勢,太同質(zhì)化了。但非常神奇的是,我今年在國外走了很多地方,無論是歐洲、日本,還是美洲,老外居然開始抄我們的。但我自己內(nèi)心還是堅(jiān)定不移地認(rèn)為,大屏不會是趨勢。
我列出了大屏四個(gè)比較大的問題。
第一,駕駛中的多任務(wù)難以兼顧。當(dāng)前的大屏在同時(shí)處理多個(gè)任務(wù)時(shí)存在明顯不足,無法高效地支持多任務(wù)操作。
第二,交互的可及性差。隨著屏幕越來越大,駕駛時(shí)我需要將視線移到屏幕上,而我的手又夠不到。比如在今年測試的一些車型中,我需要將右手完全伸直才能觸及屏幕的最右端,這不僅分散注意力,還可能影響駕駛安全。
第三,與大模型交互時(shí)的功能沖突。很多人提到物理智能,但一旦談及大模型,我們與其互動時(shí),往往需要通過大屏展示輸出結(jié)果,而這些輸出常常是滔滔不絕,毫無節(jié)制。在測試過程中,我們多次不得不喊停、打斷系統(tǒng),試圖改變話題,但大模型仍會繼續(xù)輸出,完全不理會我們的嘗試。
第四,屏幕布局往往先于交互體驗(yàn)設(shè)計(jì)。如今,許多車型開始采用異形屏幕——有凸起的、有凹進(jìn)去的、有圓形的,甚至360度的。然而,這些多樣化的屏幕設(shè)計(jì)看似提升了視覺互動的豐富性,實(shí)際上卻未能顯著改善用戶體驗(yàn)。
大模型上車一年來的答卷
今年是大模型上車的加速之年和升級之年,XAI智能體驗(yàn)實(shí)驗(yàn)室圍繞大模型上車進(jìn)行了一年的跟蹤,做了大量的評測。
先來講一下我們的方法論,我們的產(chǎn)品名字或方法論叫做P-CAFE,智能座艙大模型范式。這個(gè)方法論包括五個(gè)核心維度:感知、認(rèn)知、行動、反饋,最后是進(jìn)化。我們通過這五個(gè)維度來評估一個(gè)智艙大模型是否真的聰明,是否能夠自我迭代和進(jìn)化。
我們采用標(biāo)準(zhǔn)化的測試軟件和仿真嘴進(jìn)行測試,測試數(shù)據(jù)及語料都會進(jìn)行實(shí)時(shí)的采集和分析,能自動生成測試結(jié)果。
通過XAI Lab的測試,我們得到了幾個(gè)結(jié)論。
一個(gè)是整體能力確實(shí)大幅進(jìn)步,差距正逐步縮小。
這是我們今年測的代表車型,這些車型是我們從去年跟蹤到今年,持續(xù)進(jìn)行測評的。短短一年間有些車型已經(jīng)有了五六次的版本迭代。深色部分是2023年Q4的評分,淺色部分是今年的成績。僅僅過去了一年不到的時(shí)間,有些車型的得分已經(jīng)大幅提升,滿分為5分的評分標(biāo)準(zhǔn)下,有些車型的得分幾乎翻倍,進(jìn)步速度非???。我們自己有一個(gè)預(yù)測,到了明年,大模型將迎來真正的元年,進(jìn)入白熱化的階段。
根據(jù)XAI Lab智能體驗(yàn)實(shí)驗(yàn)室P-CAFE理論的五個(gè)維度,我們首先考察車輛在認(rèn)知層面對模糊意圖的理解。這里舉一個(gè)案例,關(guān)于“空調(diào)吹到我的臉了,不舒服”這一句話在不同車輛中的反饋。
第一款車的反饋是:“空調(diào)已經(jīng)調(diào)整到吹臉模式。” 第二款車則開始跟你閑聊,它說:“吹臉難受可以去看醫(yī)生。” 還有一款大模型則回應(yīng):“吹臉模式也稱為面部送風(fēng)模式,是空調(diào)的一種特殊送風(fēng)模式?!敝挥幸豢钴嚱o出的反饋是:“空調(diào)吹臉已經(jīng)關(guān)閉”。
除了認(rèn)知層面,我們還要看行動層面的表現(xiàn)。行動層面通過定量數(shù)據(jù)來判斷系統(tǒng)是否聰明,做得好不好。
一是首Token延時(shí)。與機(jī)器講話時(shí),我們不希望總是等它,特別是對于急性子的人來說。我們認(rèn)為,延時(shí)小于2秒是必要的標(biāo)準(zhǔn)。根據(jù)2024年Q4的測試數(shù)據(jù),我們的平均成績是1965毫秒,而GPT-4的時(shí)延是320毫秒,所以還需要很長的路要走。
二是平均文本生成速度。我們眼睛的閱讀速度大約是25 tokens/秒,而我們測得的平均文本生成速度大約是15.68 tokens/秒,也就是說,當(dāng)前的系統(tǒng)生成文本的速度還趕不上我們的眼睛,仍然顯得太慢。相比之下,GPT-4的文本生成速度是45.64 tokens/秒,已經(jīng)遠(yuǎn)遠(yuǎn)快于我們的眼睛。
三是平均任務(wù)完成率。2024年Q4的測試數(shù)據(jù)顯示,以車書功能為例,不同車型的任務(wù)完成率從68.5%到80%不等。仍然有很大的進(jìn)步空間。
還有一個(gè)問題是反饋,目前的設(shè)計(jì)仍然停留在GUI(圖形用戶界面)階段,VUI(語音交互界面)幾乎沒有,更不用說NUI(自然用戶界面)了。為什么要大模型上車?我們希望最終實(shí)現(xiàn)的是NUI,也就是自然的交互。在自然交互之前,哪怕是VUI也可以先上車。因此,我們認(rèn)為明年VUI將成為一個(gè)重要方向。
當(dāng)然,還有一個(gè)問題是分心。大量的信息需要在屏幕上反復(fù)確認(rèn),這會分散駕駛員的注意力。
最后是進(jìn)化問題。這是一個(gè)共性問題,受限于法律法規(guī),特別是汽車安全管理規(guī)定、用戶數(shù)據(jù)不能外泄以及云端架構(gòu)的限制,使得我們目前無法充分調(diào)用用戶數(shù)據(jù)來進(jìn)行優(yōu)化和系統(tǒng)訓(xùn)練。未來,圍繞出海市場,可能會有多套本地化解決方案來應(yīng)對這一挑戰(zhàn)。
2025三大趨勢
剛才提到同質(zhì)化問題很嚴(yán)重,我們希望軒轅獎(jiǎng)的評委們能夠走進(jìn)企業(yè),幫助企業(yè)做些什么呢?我們的目標(biāo)是幫助每個(gè)品牌成就自我。我個(gè)人非常期待所有品牌都能生存并且活得很好,這樣才有意義。我們認(rèn)為,2025年的新趨勢主要體現(xiàn)在三個(gè)方面:
一是,中控大屏的發(fā)展已見頂,語音與多模態(tài)交互變得越來越重要。顯示技術(shù)的多樣化和生成式AIGC界面,以及多模態(tài)交互的應(yīng)用,未來將愈加普及。
二是,差異化的硬件布局和動態(tài)氛圍的打造,將形成獨(dú)特的座艙DNA。這一點(diǎn)將在明年的設(shè)計(jì)中尤為重要,品牌和產(chǎn)品是否能夠形成獨(dú)具特色的“基因”?這種基因不僅僅是外在的,更是內(nèi)在的。
三是,企業(yè)紛紛出海,談?wù)搰H化發(fā)展。如何深入洞察目標(biāo)市場的文化背景與社會發(fā)展趨勢,并具備全局視野,這是非常必要的。
事實(shí)上,目前我們很多真實(shí)場景或“殺手級”場景的呈現(xiàn),往往有些夸張,甚至過度渲染。而且,場景本身并不一定會帶來持久的用戶粘性。這是我們對未來三大趨勢的看法。
其次,如何做得更聰明?聰明的做法應(yīng)集中在創(chuàng)新的點(diǎn)子上。我們現(xiàn)在幫助大家做減法,如何做到這一點(diǎn)呢?可以從以下三個(gè)方面入手:
1. 聚焦體驗(yàn)的效能之爭。效能體現(xiàn)在三個(gè)關(guān)鍵指標(biāo)上:時(shí)延、速率和準(zhǔn)確性,這些決定了體驗(yàn)的優(yōu)劣。
2. 感知場景的主動推薦。例如,車主坐進(jìn)車內(nèi)后,系統(tǒng)自動彈出提示框,詢問是否開啟按摩座椅。通過識別、推理和決策的無縫連接,整個(gè)過程可以一氣呵成。
3. 靈活精準(zhǔn)的跨域融合。如何構(gòu)建生態(tài)、落域與調(diào)用?就像這個(gè)案例中所展示的,導(dǎo)航域與娛樂域的無縫切換,或是根據(jù)需求調(diào)用不同服務(wù)。生態(tài)、落域和調(diào)用的跨域融合,可以通過大模型來實(shí)現(xiàn),從而提升整體系統(tǒng)的智能化水平。
最后,我想與大家分享的是,企業(yè)如何提升自己的關(guān)鍵競爭力。軒轅獎(jiǎng)的所有評委們也希望能夠幫助大家找到獨(dú)特的DNA,并與企業(yè)共同打造這一過程。
在今年的評選過程中,出現(xiàn)了許多富有爭議的案例。比如,我個(gè)人非常喜歡某個(gè)迷你小圓屏,盡管它是異形屏,邏輯設(shè)計(jì)還有待優(yōu)化,但它確實(shí)代表了一種獨(dú)特的屏幕設(shè)計(jì)思路。包括標(biāo)志性的顏色,不僅僅是氛圍燈本身,屏幕難道也不是一種“燈”嗎?標(biāo)志性的顏色同樣能夠成為品牌的DNA。
科技感的體現(xiàn),一定是實(shí)體按鍵的回歸,甚至是實(shí)體按鍵與虛擬按鍵的結(jié)合。如何將兩者巧妙融合,也是一種趨勢。當(dāng)然,也會有新的創(chuàng)新顯示技術(shù)涌現(xiàn),視覺交互變得越來越多樣,像P-HUD、裸眼3D HUD等,如何將這些技術(shù)融為一體,形成獨(dú)特的氛圍和意境,就是體現(xiàn)DNA高級感的關(guān)鍵。
我們有一套方法論,幫助企業(yè)走向國際化,叫做CXP-9,通過文化視角為企業(yè)提供解決方案。例如,中國的年輕人喜歡“悅己”,而歐洲人則追求“普世”。圍繞文化場景,我們可以輕松將UI轉(zhuǎn)化為VUI,甚至NUI。通過大模型的支持,企業(yè)可以更方便地理解市場洞察。這套方法論涵蓋了從文化體驗(yàn)到產(chǎn)品研究的全鏈條,助力企業(yè)打造符合自身特色的全球化產(chǎn)品。
最后,也是今天演講的重要總結(jié),大模型上車的時(shí)代,企業(yè)需要建立大模型能力的全局觀,XAI-Lab智能體驗(yàn)實(shí)驗(yàn)室經(jīng)過了一年多的探索,總結(jié)出了一套行之有效的能力評價(jià)方法。今年12月31日,我們XAI-Lab智能體驗(yàn)實(shí)驗(yàn)室將會發(fā)布一款幫助企業(yè)建立大模型全局觀的產(chǎn)品,歡迎大家關(guān)注。