會聊天的電腦!體驗iVoka語音交互技術(shù)
通過語言和聲音表達(dá)自己的意愿是人與人之間交流的基本方式,但人與機器之間存在著各種各樣的交流障礙。如何突破這種局限,在人與人之間形成充滿智慧和溫暖的人機交互,是人類一直在努力的方向。iPhone 4S的發(fā)布開創(chuàng)了這個先例。Siri的語音人機交互功能讓機器不再冰冷,但遺憾的是,中國消費者并沒有享受到。不過,目前SAIC已經(jīng)推出了一款應(yīng)用于汽車、類似Siri系統(tǒng)的iVoka語音云交互技術(shù)。中文語音系統(tǒng)讓中國人率先體驗到人機交互系統(tǒng)的魅力和樂趣。
》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》
要實現(xiàn)這個功能,首先需要通過藍(lán)牙將手機中的聯(lián)系方式傳輸?shù)絠Voka車載系統(tǒng),通過語音命令iVoka進(jìn)行通話。當(dāng)來電時,系統(tǒng)還會詢問用戶是否要語音接聽。
●接收/發(fā)送短信
通過語音發(fā)送和獲取短信的內(nèi)容,可以讓駕駛員更加注意駕駛車輛。但在語音輸入短信時,用戶必須使用標(biāo)準(zhǔn)普通話,否則系統(tǒng)會產(chǎn)生誤識別。同時,由于中文復(fù)調(diào),系統(tǒng)偶爾會誤解用戶的語音命令。
●導(dǎo)航
進(jìn)入導(dǎo)航功能后,有兩種方式搜索特定目的地。一是通過語音與iVoka車載系統(tǒng)交互;另一種可以遠(yuǎn)程呼叫客服人員,將目的地信息下載到導(dǎo)航地圖上,通過人際溝通實現(xiàn)車輛導(dǎo)航。
聽音樂/資訊查詢●信息查詢
通過語音交互系統(tǒng)可以實現(xiàn)的信息查詢包括當(dāng)前某個城市的時間、日期、天氣情況以及航班信息,應(yīng)該說是比較有限的。但隨著功能的逐漸豐富,未來會增加更多可以通過人機交互系統(tǒng)完成的信息查詢和獲取,如股票、新聞等。
●聽音樂和收音機。
聽音樂可以分為兩種情況。一種是讀取本地電腦上的音樂文件,也就是SD卡,可以通過語音命令直接說出想要聽的歌曲名稱。這時,iVoka系統(tǒng)會播放這種音樂。另一種是通過系統(tǒng)的3G網(wǎng)絡(luò)聽在線音樂,但是就是不支持在線音樂的搜索功能。
在收聽電臺時,用戶只需說出電臺的頻率,系統(tǒng)就可以直接切換到相應(yīng)的電臺,同時通過語音指令即可采集到喜歡的電臺。未來用戶還可以發(fā)出類似“聽北京音樂臺、北京交通臺”的指令,讓系統(tǒng)直接跳轉(zhuǎn)到對應(yīng)的電臺,用戶無需寫下電臺的頻率。
這款iVoka汽車智能系統(tǒng)是一個開放的安卓系統(tǒng),通過安裝各種第三方軟件可以豐富其功能。再加上觸控屏,年輕人上手容易,操作智能手機一樣輕松。
●目前還像個兩三歲的孩子。未來它會通過“教育”變得越來越聰明。
目前這個系統(tǒng)還處于測試階段,所以還存在很多不完善的地方,主要問題集中在以下幾點:
① iVoka系統(tǒng)已經(jīng)能夠識別一個意思的多種表達(dá)方式,讓用戶不必糾結(jié)于嚴(yán)謹(jǐn)?shù)恼Z法結(jié)構(gòu),但由于中文的深刻性,難免會出現(xiàn)無法識別的語言表達(dá)方式。
②目前iVoka系統(tǒng)只支持普通話,每一條語音指令都需要用戶看清楚,否則系統(tǒng)會出錯或無法識別。
③系統(tǒng)響應(yīng)速度受硬件限制,不夠令人滿意。系統(tǒng)響應(yīng)用戶發(fā)出的每一條指令至少需要2秒鐘。
④人機交互系統(tǒng)不夠人性化。因為iVoka的語音回復(fù)詞庫是預(yù)植入系統(tǒng)的,詞庫的豐富性決定了它能否像人類對話一樣被賦予多重情感。
⑤這個iVoka系統(tǒng)通過語音交互實現(xiàn)的功能還是比較有限的。除了接聽和撥打電話等常用功能外,還有很多其他功能仍然需要通過傳統(tǒng)手寫來實現(xiàn)。
目前伊沃卡的理解力、表達(dá)能力和智商還像個兩三歲的孩子。成年人之間的言語,伊沃卡可能聽不懂,自然也不可能做出合理的回應(yīng),更談不上深入或情感上的交流。但是,通過不斷對它進(jìn)行語言教育,培養(yǎng)它的邏輯思維能力,相信它會越來越接近人類的智商,使人與機器的互動更加容易。
●運營成本
系統(tǒng)采用聯(lián)通3G套餐服務(wù),前兩年免費,包括100分鐘通話時間,每月400兆流量。根據(jù)目前的反饋,這樣的資費內(nèi)容可以滿足大部分用戶的使用需求。
更多精彩視頻,均在車載家庭視頻頻道。
全文摘要:
這個系統(tǒng)相當(dāng)于搭建了一個框架或者平臺。隨著更多新功能的加入和人機交互系統(tǒng)的不斷完善,未來其功能將更加豐富,更加人性化。然而,機器理解有著幾千年歷史的人類語言,并不是一次性的事情。這種認(rèn)知對于深刻理解人類文明是不可或缺的。只有這樣,機器才能深刻理解人類每一個字和詞的含義,達(dá)到人與人之間一樣充滿智慧、溫暖和幽默的交流方式。
>>點擊查看今日優(yōu)惠<<