av人摸人人人澡人人超清,日本黄网站色视频免费,香焦伊人,三级av毛片在线播放,自慰在线观看18p,超碰欧美亚洲日韩,午夜激情涩涩网

車(chē)聯(lián)網(wǎng)名詞注解系列(上)語(yǔ)音控制篇

2025-02-19 15:24:03 作者:資訊小編
什么是STT?何為TTS?

在過(guò)去一年的智能汽車(chē)測(cè)試項(xiàng)目中,總有朋友提問(wèn):文章中我們提到的很多名詞,從字面上很難理解,有時(shí)候讓人摸不著頭腦。正好趁這個(gè)機(jī)會(huì)在家里“安頓”一下自己,我們就展開(kāi)一個(gè)系列,把那些晦澀難懂的專(zhuān)有名詞給大家一一注釋?zhuān)f(shuō)說(shuō)它們的含義、背景和意義,也為以后相關(guān)文章中的參考做好準(zhǔn)備。第一期,我們來(lái)說(shuō)說(shuō)語(yǔ)音控制中的一些常見(jiàn)名詞。

STT和TTS

常見(jiàn)的互聯(lián)網(wǎng)知識(shí)告訴我們,當(dāng)兩個(gè)字母/數(shù)字之間有一個(gè)“t”或“2”時(shí),指的是“to”字的概率很高,例如P2P、B2C、V2X、STT和TTS都是類(lèi)似的。

在一些技術(shù)文獻(xiàn)中,這一環(huán)節(jié)又被稱為ASR,是一項(xiàng)集語(yǔ)言學(xué)、計(jì)算機(jī)科學(xué)和電氣工程等領(lǐng)域的知識(shí)和研究于一體的復(fù)雜工程。

我們?cè)跇?biāo)語(yǔ)中經(jīng)常聽(tīng)到的“語(yǔ)音引擎”通常是指這五個(gè)環(huán)節(jié)的集合。在研發(fā)過(guò)程中,雖然有些供應(yīng)有完整的解決方案,但一輛車(chē)的語(yǔ)音控制系統(tǒng)往往會(huì)在不同的環(huán)節(jié)選擇不同的供應(yīng)商,相互配合,達(dá)到最終的效果。

除了我們上面解釋的單詞之外,自然語(yǔ)言處理是將用戶的指令轉(zhuǎn)換成結(jié)構(gòu)化和機(jī)器可理解的語(yǔ)言。

語(yǔ)音控制是一項(xiàng)復(fù)雜的功能,涉及語(yǔ)言學(xué)、計(jì)算機(jī)科學(xué)、電氣工程等。,它是云和本地的結(jié)合。往往需要車(chē)企電氣部門(mén)和多個(gè)供應(yīng)商同時(shí)配合才能達(dá)到最佳效果。對(duì)于服務(wù)提供商來(lái)說(shuō),提供最好的產(chǎn)品需要多年的語(yǔ)言分析和指令集積累。做好真的不容易。

啥?連續(xù)說(shuō)?免喚醒?

一個(gè)熱的連續(xù)理論,沒(méi)有喚醒

在過(guò)去一年的車(chē)內(nèi)語(yǔ)音控制測(cè)試中,有兩個(gè)“高頻詞”——一拍連續(xù)和不喚醒。除了“識(shí)別率”,它們也是我們最喜歡的語(yǔ)音控制功能。

你有沒(méi)有想過(guò)為什么要喚醒文字?因?yàn)槿藗冊(cè)谌粘=涣髦泻苋菀子|發(fā)語(yǔ)音控制中的某些功能,喚醒詞就是指定一個(gè)時(shí)間段,在此期間語(yǔ)音引擎會(huì)對(duì)你說(shuō)的話進(jìn)行處理反饋。在目前的語(yǔ)音控制技術(shù)下,如果沒(méi)有喚醒詞,就會(huì)被車(chē)內(nèi)語(yǔ)音控制騷擾到自閉。

為什么不能像日常交流一樣直呼自己的名字?比如:李湘,幫我打開(kāi)空鍵。也是因?yàn)閮扇齻€(gè)字的名字容易被誤認(rèn),導(dǎo)致語(yǔ)音控制誤觸發(fā)。因此,喚醒詞通常設(shè)置為“重疊”、“你好+名字”和“同學(xué)”,以降低誤觸發(fā)的概率。

但這也導(dǎo)致了一個(gè)問(wèn)題——人與人之間的溝通方式完全不同!下圖是基本的車(chē)內(nèi)語(yǔ)音控制通訊方式。你覺(jué)得特別眼熟嗎?

OneShot是什么意思?很簡(jiǎn)單,就是喚醒詞可以和指令一起說(shuō),而不是先說(shuō)喚醒詞,等待系統(tǒng)響應(yīng)后再給出指令。有了OneShot連續(xù)通話功能,情況就是這樣。

喚醒詞是什么意思?顧名思義,連喚醒詞都不需要。您可以不調(diào)用語(yǔ)音控制功能直接給出指令,如下所示:

不,這是一個(gè)越來(lái)越接近人們交流方式的過(guò)程,也是一個(gè)越來(lái)越不禮貌的過(guò)程。是的,人們交流的方式是不禮貌的。

以上就是OneShot和不叫醒的意義和意義。至于“免醒”這個(gè)詞,我想在這里多說(shuō)幾句。在這個(gè)階段,免喚醒可以分為兩種模式。

或者在音樂(lè)播放界面,不用先喚醒語(yǔ)音控制功能,直接說(shuō)“暫?!?、“下一首歌”、“提高音量”。這是目前使用最廣泛的免喚醒方案。

部分車(chē)型采用了這種邏輯。)搭配科大訊飛語(yǔ)音引擎。

在這里,我們也可以看到,在大部分功能都可以直接給出指令的情況下,系統(tǒng)還是需要限定一個(gè)時(shí)間的。如果時(shí)間沒(méi)有限制,誤喚醒的概率還是不能接受的。想象一下,你和副駕駛正愉快地聊著今天的好天氣。突然,系統(tǒng)開(kāi)始自言自語(yǔ):“今天北京陽(yáng)光明媚,空空氣質(zhì)量……”如果這種情況發(fā)生兩次,您可能會(huì)永久關(guān)閉語(yǔ)音控制功能。

總結(jié)

在《車(chē)聯(lián)網(wǎng)名詞注釋系列》第一期中,我們解釋了語(yǔ)音控制系統(tǒng)的幾個(gè)名詞,并講述了它們的定義、背景和價(jià)值。事實(shí)上,人與人之間的交流大多是通過(guò)“說(shuō)”和“聽(tīng)”來(lái)實(shí)現(xiàn)的。當(dāng)然,我們也有表情、手勢(shì)等等。相比之下,機(jī)器更難理解表情和手勢(shì)的含義。各大車(chē)企、研究機(jī)構(gòu)、語(yǔ)音交互解決方案提供商口中的類(lèi)人交互,就是讓機(jī)器學(xué)會(huì)理解語(yǔ)言、手勢(shì),甚至是感受。作為其中之一,語(yǔ)音控制才剛剛起步。在我們進(jìn)入下一個(gè)更智能的階段之前,“處理”什么時(shí)候才能真正變成“理解”。

>>點(diǎn)擊查看今日優(yōu)惠<<

    本文導(dǎo)航
    熱門(mén)文章
    TOP推薦
    相關(guān)閱讀
    點(diǎn)擊加載更多