車(chē)聯(lián)網(wǎng)名詞注解系列(上)語(yǔ)音控制篇
在過(guò)去一年的智能汽車(chē)測(cè)試項(xiàng)目中,總有朋友提問(wèn):文章中我們提到的很多名詞,從字面上很難理解,有時(shí)候讓人摸不著頭腦。正好趁這個(gè)機(jī)會(huì)在家里“安頓”一下自己,我們就展開(kāi)一個(gè)系列,把那些晦澀難懂的專(zhuān)有名詞給大家一一注釋?zhuān)f(shuō)說(shuō)它們的含義、背景和意義,也為以后相關(guān)文章中的參考做好準(zhǔn)備。第一期,我們來(lái)說(shuō)說(shuō)語(yǔ)音控制中的一些常見(jiàn)名詞。
STT和TTS
常見(jiàn)的互聯(lián)網(wǎng)知識(shí)告訴我們,當(dāng)兩個(gè)字母/數(shù)字之間有一個(gè)“t”或“2”時(shí),指的是“to”字的概率很高,例如P2P、B2C、V2X、STT和TTS都是類(lèi)似的。
在一些技術(shù)文獻(xiàn)中,這一環(huán)節(jié)又被稱為ASR,是一項(xiàng)集語(yǔ)言學(xué)、計(jì)算機(jī)科學(xué)和電氣工程等領(lǐng)域的知識(shí)和研究于一體的復(fù)雜工程。
我們?cè)跇?biāo)語(yǔ)中經(jīng)常聽(tīng)到的“語(yǔ)音引擎”通常是指這五個(gè)環(huán)節(jié)的集合。在研發(fā)過(guò)程中,雖然有些供應(yīng)商有完整的解決方案,但一輛車(chē)的語(yǔ)音控制系統(tǒng)往往會(huì)在不同的環(huán)節(jié)選擇不同的供應(yīng)商,相互配合,達(dá)到最終的效果。
除了我們上面解釋的單詞之外,自然語(yǔ)言處理是將用戶的指令轉(zhuǎn)換成結(jié)構(gòu)化和機(jī)器可理解的語(yǔ)言。
語(yǔ)音控制是一項(xiàng)復(fù)雜的功能,涉及語(yǔ)言學(xué)、計(jì)算機(jī)科學(xué)、電氣工程等。,它是云和本地的結(jié)合。往往需要車(chē)企電氣部門(mén)和多個(gè)供應(yīng)商同時(shí)配合才能達(dá)到最佳效果。對(duì)于服務(wù)提供商來(lái)說(shuō),提供最好的產(chǎn)品需要多年的語(yǔ)言分析和指令集積累。做好真的不容易。
啥?連續(xù)說(shuō)?免喚醒?一個(gè)熱的連續(xù)理論,沒(méi)有喚醒
在過(guò)去一年的車(chē)內(nèi)語(yǔ)音控制測(cè)試中,有兩個(gè)“高頻詞”——一拍連續(xù)和不喚醒。除了“識(shí)別率”,它們也是我們最喜歡的語(yǔ)音控制功能。
你有沒(méi)有想過(guò)為什么要喚醒文字?因?yàn)槿藗冊(cè)谌粘=涣髦泻苋菀子|發(fā)語(yǔ)音控制中的某些功能,喚醒詞就是指定一個(gè)時(shí)間段,在此期間語(yǔ)音引擎會(huì)對(duì)你說(shuō)的話進(jìn)行處理反饋。在目前的語(yǔ)音控制技術(shù)下,如果沒(méi)有喚醒詞,就會(huì)被車(chē)內(nèi)語(yǔ)音控制騷擾到自閉。
為什么不能像日常交流一樣直呼自己的名字?比如:李湘,幫我打開(kāi)空鍵。也是因?yàn)閮扇齻€(gè)字的名字容易被誤認(rèn),導(dǎo)致語(yǔ)音控制誤觸發(fā)。因此,喚醒詞通常設(shè)置為“重疊”、“你好+名字”和“同學(xué)”,以降低誤觸發(fā)的概率。
但這也導(dǎo)致了一個(gè)問(wèn)題——人與人之間的溝通方式完全不同!下圖是基本的車(chē)內(nèi)語(yǔ)音控制通訊方式。你覺(jué)得特別眼熟嗎?
OneShot是什么意思?很簡(jiǎn)單,就是喚醒詞可以和指令一起說(shuō),而不是先說(shuō)喚醒詞,等待系統(tǒng)響應(yīng)后再給出指令。有了OneShot連續(xù)通話功能,情況就是這樣。
喚醒詞是什么意思?顧名思義,連喚醒詞都不需要。您可以不調(diào)用語(yǔ)音控制功能直接給出指令,如下所示:
不,這是一個(gè)越來(lái)越接近人們交流方式的過(guò)程,也是一個(gè)越來(lái)越不禮貌的過(guò)程。是的,人們交流的方式是不禮貌的。
以上就是OneShot和不叫醒的意義和意義。至于“免醒”這個(gè)詞,我想在這里多說(shuō)幾句。在這個(gè)階段,免喚醒可以分為兩種模式。
或者在音樂(lè)播放界面,不用先喚醒語(yǔ)音控制功能,直接說(shuō)“暫?!?、“下一首歌”、“提高音量”。這是目前使用最廣泛的免喚醒方案。
部分車(chē)型采用了這種邏輯。)搭配科大訊飛語(yǔ)音引擎。
在這里,我們也可以看到,在大部分功能都可以直接給出指令的情況下,系統(tǒng)還是需要限定一個(gè)時(shí)間的。如果時(shí)間沒(méi)有限制,誤喚醒的概率還是不能接受的。想象一下,你和副駕駛正愉快地聊著今天的好天氣。突然,系統(tǒng)開(kāi)始自言自語(yǔ):“今天北京陽(yáng)光明媚,空空氣質(zhì)量……”如果這種情況發(fā)生兩次,您可能會(huì)永久關(guān)閉語(yǔ)音控制功能。
總結(jié)
在《車(chē)聯(lián)網(wǎng)名詞注釋系列》第一期中,我們解釋了語(yǔ)音控制系統(tǒng)的幾個(gè)名詞,并講述了它們的定義、背景和價(jià)值。事實(shí)上,人與人之間的交流大多是通過(guò)“說(shuō)”和“聽(tīng)”來(lái)實(shí)現(xiàn)的。當(dāng)然,我們也有表情、手勢(shì)等等。相比之下,機(jī)器更難理解表情和手勢(shì)的含義。各大車(chē)企、研究機(jī)構(gòu)、語(yǔ)音交互解決方案提供商口中的類(lèi)人交互,就是讓機(jī)器學(xué)會(huì)理解語(yǔ)言、手勢(shì),甚至是感受。作為其中之一,語(yǔ)音控制才剛剛起步。在我們進(jìn)入下一個(gè)更智能的階段之前,“處理”什么時(shí)候才能真正變成“理解”。
>>點(diǎn)擊查看今日優(yōu)惠<<
-
1比亞迪2027年啟動(dòng)固態(tài)電池批量裝車(chē) 2030年大規(guī)模應(yīng)用
- 2至高降17.3萬(wàn)元 奧迪Q7限時(shí)售45.99萬(wàn)起
- 3東風(fēng)日產(chǎn)推一口價(jià)活動(dòng) 軒逸最低6.98萬(wàn)元起
- 4尚界首款車(chē)型信息曝光 預(yù)計(jì)15萬(wàn)元起售
- 5預(yù)售8.98萬(wàn)起 埃安AION UT將于2月28日上市 純電續(xù)航420km
- 6直降5萬(wàn)元 全新寶馬X3長(zhǎng)軸距版售34.99萬(wàn)起 軸距2975mm/動(dòng)力提升
- 7小米SU7 Ultra太空銀配色實(shí)車(chē)曝光 新車(chē)2月底上市
相關(guān)閱讀點(diǎn)擊加載更多熱門(mén)搜索 熱門(mén)IT產(chǎn)品 最新車(chē)系 - 2至高降17.3萬(wàn)元 奧迪Q7限時(shí)售45.99萬(wàn)起