語音接口技術(shù)淺析
語音接口已經(jīng)成為一個改變?nèi)藱C交互方式的全新切入點。這些系統(tǒng)如何工作?打造這樣一款設(shè)備在硬件方面有什么要求?隨著語音控制接口變得越來越普及,德州儀器(TI)的一位工程師對此技術(shù)進行了深入的了解,并分享了其對這項技術(shù)的認(rèn)識和看法。
語音接口是什么?
語音識別技術(shù)自20世紀(jì)50年代起開始出現(xiàn)在我們身邊。那時貝爾實驗室的工程師創(chuàng)建了一款可以識別單個數(shù)字的系統(tǒng)。然而,語音識別只是完整語音接口技術(shù)的一部分。語音接口包含傳統(tǒng)用戶接口的所有方面:它能呈現(xiàn)信息并為用戶提供一種操控方式。在語音接口中,操控、甚至一些信息的呈現(xiàn)都將通過語音實現(xiàn)。在一些如按鈕或顯示屏等傳統(tǒng)的用戶接口上,也可能配置語音接口這一選項。
大部分人遇到的第一款語音接口設(shè)備很有可能是移動電話,或者是個人電腦上非;A(chǔ)的將語言轉(zhuǎn)換成文字的程序。然而,這些設(shè)備的運行都非常緩慢、識別不精確且可識別的詞匯有限。
那是什么將語音識別從一種附屬性功能變成了計算機世界炙手可熱的技術(shù)呢?首先,如今的計算能力和算法性能都有顯著的提高(如果你對隱馬爾科夫模型有所了解,對此你會有更直觀的認(rèn)識)。其次,云技術(shù)和大數(shù)據(jù)分析的應(yīng)用也改進了語音識別效果,并且提高了識別的速度和準(zhǔn)確性。
為你的設(shè)備添加語音識別功能
一些人常常會對如何為項目添加某種語音接口存在疑問。實際上,TI供應(yīng)幾種不同的語音接口產(chǎn)品,包括ARM®處理器的Sitara™系列產(chǎn)品和C5000™ DSP系列產(chǎn)品,這些產(chǎn)品都具備語音處理的能力。兩種系列的產(chǎn)品各有千秋,分別適用于不同的應(yīng)用。
在選擇DSP和ARM這兩種解決方案時,考慮的關(guān)鍵因素在于這款設(shè)備能否或?qū)⑷绾卫迷普Z音平臺。當(dāng)中有三種應(yīng)用場景:第一種是離線,所有的處理過程都在本地設(shè)備上發(fā)生。第二種是在線,通過基于云端的語音處理設(shè)備,如亞馬遜的Alexa,谷歌助手或IBM Watson;第三種是兩者混合。
離線:車載語音控制
從目前的發(fā)展趨勢來看,人們似乎希望所有事物都能夠連接至互聯(lián)網(wǎng)。然而,無論是出于成本考慮或是缺乏可靠的網(wǎng)絡(luò)連接,在某些應(yīng)用中,連接網(wǎng)絡(luò)的意義其實不大。在現(xiàn)代的汽車應(yīng)用中,許多娛樂信息系統(tǒng)就采用了離線語音接口系統(tǒng)。這些語音接口系統(tǒng)通常只能使用有限的命令集,如“撥打電話”、“播放音樂”和“提高或降低音量”。雖然傳統(tǒng)處理器的語音識別算法取得了重大進展,但仍有不盡如人意之處。遇到這樣的情況,例如C55xx等DSP可能夠為系統(tǒng)提供較佳的性能。
在線:智能家庭中樞
關(guān)于語音接口的很多熱議主要圍繞于例如Google Home和亞馬遜 Alexa等互聯(lián)設(shè)備。由于亞馬遜允許第三方進入其已配備Alex語音服務(wù)的語音處理生態(tài)系統(tǒng),他們在這方面的發(fā)展備受矚目。另外,如Microsoft Azur等其它的云服務(wù)也可以提供語音識別服務(wù)和類似功能。值得注意的是,這些設(shè)備的聲音處理過程全部發(fā)生在云端。
是否值得為了這種便捷的集成而向語音服務(wù)供應(yīng)商提供上行數(shù)據(jù)完全取決于用戶。但是,云服務(wù)供應(yīng)商承擔(dān)了主要的工作,設(shè)備商需要做的很簡單,實際上,由于接口的語音合成部分也發(fā)生在云端,Alexa只要完成較簡單的功能,即播放并記錄錄音文件。既然不需要特別的信號處理功能,ARM處理器足以處理接口工作。這意味著,如果你的設(shè)備已配備ARM處理器,你就可能集成云計算語音接口。
事實上,關(guān)注Alexa等不能提供的服務(wù)也是非常重要的。Alexa不直接執(zhí)行任何一種設(shè)備控制或云集成。驅(qū)動Alexa的許多“智能設(shè)備”都具備云計算功能,該功能由開發(fā)商提供,可以利用Alexa的語音處理能力將驅(qū)動輸入至現(xiàn)有的云應(yīng)用。例如,如果你告訴Alexa需要訂一個披薩,你較喜愛的披薩店則需要為Alexa編制一項“技能”。該項技能是一個可以在你訂披薩時定義工作內(nèi)容的代碼。當(dāng)你每次訂披薩時,Alexa都會調(diào)用該技能。該技能嵌入了可以為你下單的在線訂購系統(tǒng)。同樣,智能家居設(shè)備制造商必須執(zhí)行Alexa如何與本地設(shè)備和在線服務(wù)相互作用的技能。亞馬遜自帶許多這樣的技能,加上第三方開發(fā)者提供的技能,即便你沒有開發(fā)任何技能,Alexa設(shè)備仍然可以非常有用。
混合:互聯(lián)自動調(diào)溫器
有時,即使沒有連接互聯(lián)網(wǎng),我們也有保證設(shè)備的某些基礎(chǔ)功能可以正常使用的需求。例如:在連不上網(wǎng)的時候,如果自動調(diào)溫器不會自主調(diào)節(jié)溫度,這就會是一個很麻煩的問題。為避免這種問題的發(fā)生 ,一個好的產(chǎn)品設(shè)計師會設(shè)計一些本地的聲音處理功能,在功能上實現(xiàn)無縫銜接。為了實現(xiàn)此功能,系統(tǒng)必須具有DSP,例如用于本地語音處理的C55XX和用于將已連網(wǎng)的接口連接至云端的ARM處理器。
語音觸發(fā)又是什么?
你也許已經(jīng)注意到了,直到現(xiàn)在我們還沒有提及新一代語音助手真正神奇的地方:那就是始終關(guān)注“觸發(fā)詞匯”。它們將如何追蹤你在房間內(nèi)任意位置所發(fā)出的聲音,或是當(dāng)設(shè)備播放音頻時,又如何聽到你的聲音?實現(xiàn)這些其實并沒有什么特別神奇的地方,只需要一些智能化軟件。這類軟件獨立于云端的語音接口,也能在系統(tǒng)離線的狀態(tài)下運行。
這個系統(tǒng)較易理解的部分就是“喚醒詞匯”。喚醒詞匯是一個簡單的本地語音識別程序,通過持續(xù)性采樣,在接收的音頻信號中尋找單個詞匯。由于大多數(shù)語音服務(wù)均樂意接受不含喚醒詞匯的音頻,因此該詞匯不需要指定任何特殊的語音平臺。因為實現(xiàn)這種功能的要求相對較低,所以通過利用Sphinx或KITT.AI等開源數(shù)據(jù)庫在ARM處理器上即可完成操作。
為了聽到你在房間內(nèi)任意位置發(fā)出的聲音,語音識別設(shè)備采用一個叫波束成型的流程。較重要的是,通過對比不同聲音的到達時間和麥克風(fēng)間的距離來確定聲音的來源。一旦確認(rèn)了目標(biāo)聲音的位置,設(shè)備就會采用如空間濾波等音頻處理技術(shù)來進一步減少噪音并增強信號質(zhì)量。波束成型的實現(xiàn)取決于麥克風(fēng)的布局。真正實現(xiàn)360度識別則需要一個非線性麥克風(fēng)陣列(通常是圓形)。對于壁掛式設(shè)備而言,僅需兩個麥克風(fēng)就能啟用180度的空間辨別。
語音助手的較后一招是采用自動回波消除(AEC)。AEC在某種程度上類似于噪音消除耳機,但應(yīng)用恰好相反。該算法是利用已知的音樂等輸出音頻信號來實現(xiàn)的。在噪音消除耳機利用這點來消除外部雜音,AEC消除了輸出信號對輸入信號在麥克風(fēng)上的影響。該設(shè)備能忽略自身產(chǎn)生的音頻,且無論揚聲器播放何種內(nèi)容,其都仍然能接收。實現(xiàn)AEC需要大量的計算,其中在DSP中效果較佳。
為了實施喚醒識別、波束成型和AEC等以上提及的所有功能,則要求ARM處理器配合DSP共同工作:DSP增強了所有的信號處理功能,而ARM處理器控制設(shè)備邏輯和接口。DSP可在執(zhí)行輸入數(shù)據(jù)管路方面發(fā)揮重要的作用,由此較大限度地減少處理的延遲,從而提供更好的用戶體驗。ARM可以自由運行如Linux等高級操作系統(tǒng)以控制其它設(shè)備。這樣高級的功能全部發(fā)生在本地,若使用云服務(wù),將只接收包含較終處理結(jié)果的單個語音文件。
結(jié)論
語音接口似乎已收獲了超高的人氣,并且將在未來很長一段時間內(nèi)以不同形式出現(xiàn)在我們的生活中。盡管有多種不同的處理方式可以實現(xiàn)語音接口服務(wù),但無論你的應(yīng)用需要何種裝置,TI都可以為你提供理想的選擇。
相關(guān)閱讀:
- ...· “芯創(chuàng)杯”首屆高校未來汽車人機交互設(shè)計大賽報名正式啟動
- ...· 探秘第二屆衛(wèi)藍山鷹“創(chuàng)新·共享”試驗技術(shù)論壇!
- ...· “2018中國半導(dǎo)體生態(tài)鏈大會”在江蘇省盱眙舉行
- ...· 新主題新規(guī)劃,CITE 2019瞭望智慧未來
- ...· 從汽車到工廠,TI毫米波傳感器致力于創(chuàng)造更智能的世界
- ...· 意法半導(dǎo)體(ST)、Cinemo和Valens在CES 2018展上聯(lián)合演示汽車信息娛樂解決方案
- ...· 北京集成電路產(chǎn)業(yè)創(chuàng)新發(fā)展高峰論壇即將在京召開
- ...· 三菱電機強勢出擊PCIM亞洲2017展
- ...· GPGPU國產(chǎn)替代:中國芯片產(chǎn)業(yè)的空白地帶
- ...· 物聯(lián)網(wǎng)產(chǎn)品設(shè)計中Wi-Fi連接的四個關(guān)鍵因素
- ...· 第三屆中國MEMS智能傳感器產(chǎn)業(yè)發(fā)展大會即將于蚌埠拉開帷幕
- ...· IAIC專項賽演繹“中國芯“應(yīng)用創(chuàng)新,信息安全高峰論壇亮劍海寧
- ...· 智能控制有源鉗位反激
- ...· 解讀5G毫米波OTA 測試技術(shù)
- ...· 多個市場高速增長推動Molex加強汽車領(lǐng)域的發(fā)展
- ...· 中國綠色制造聯(lián)盟成立大會召開在即 政產(chǎn)學(xué)研用共探綠色發(fā)展新模式
- ...· Efinix® 全力驅(qū)動AI邊緣計算,成功推出Trion™ T20 FPGA樣品, 同時將產(chǎn)品擴展到二十萬邏輯單元的T200 FPGA
- ...· 英飛凌亮相進博會,引領(lǐng)智慧新生活
- ...· 三電產(chǎn)品開發(fā)及測試研討會北汽新能源專場成功舉行
- ...· Manz亞智科技跨入半導(dǎo)體領(lǐng)域 為面板級扇出型封裝提供化學(xué)濕制程、涂布及激光應(yīng)用等生產(chǎn)設(shè)備解決方案
- ...· 中電瑞華BITRODE動力電池測試系統(tǒng)順利交付北汽新能源
- ...· 中電瑞華FTF系列電池測試系統(tǒng)中標(biāo)北京新能源汽車股份有限公司
- ...· 中電瑞華大功率高壓能源反饋式負(fù)載系統(tǒng)成功交付中電熊貓
- ...· 中電瑞華國際在電動汽車及關(guān)鍵部件測評研討會上演繹先進測評技術(shù)
產(chǎn)品快訊更多
企業(yè)新聞更多
- ...· 數(shù)據(jù)采集終端系統(tǒng)設(shè)備
- ...· 簡儀科技踏上新征程
- ...· 易靈思® 宣布 AEC-Q100 資質(zhì)認(rèn)證和汽車系列產(chǎn)品計劃
- ...· 易靈思® 宣布擴充高性能 鈦金系列™ FPGA 產(chǎn)品 鈦金系列產(chǎn)品擴充至包含 1M 邏輯單元的 FPGA
- ...· 易靈思® 宣布Trion® Titanium 在臺積電 (TSMC) 16納米工藝節(jié)點流片
- ...· TI杯2019年全國大學(xué)生電子設(shè)計競賽頒獎典禮在京舉行
- ...· BlackBerry QNX虛擬機獲得全球首個汽車安全完整性等級(ASIL) ‘D’認(rèn)證
- ...· 威馬汽車選擇BlackBerry助力下一代汽車