語音識別技術的原理及應用

2017年12月08日 14:38$artinfo.Reprint點擊量：2808

　　上周，百度宣布語音技術全系列接口*免費開放，提供語音識別、語音合成、語音喚醒多平臺SDK (軟件開發工具包)，支持和合作伙伴。語音交互是人與機器“交流”的重要環節，百度宣布語音技術全系列接口*免費，或將帶來一場巨大的行業變革。

　　智能語音技術是人工智能產業鏈上的關鍵一環。人工智能產業鏈主要分為三個層次。底層是基礎設施，包括芯片、模組、傳感器，以及大數據平臺、云計算服務和網絡運營商；中間層是基礎技術研究和服務提供商，包括深度學習、計算機視覺、語音技術和自然語言處理以及機器人等領域；上層是行業應用，包括智能家居、可穿戴設備、無人駕駛、虛擬助理、家庭機器人等。

　　語音識別技術原理是什么？

　　語音識別系統構建過程整體上包括兩大部分：訓練和識別。訓練是指對預先收集好的語音進行信號處理和知識挖掘，獲取語音識別系統所需要的“聲學模型”和“語言模型”；識別是對用戶實時語音進行自動識別。識別過程通常又可以分為“前端”和“后端”兩大模塊：“前端”主要作用是進行端點檢測(去除多余的*和非說話聲)、降噪、特征提取等；“后端”作用是利用訓練好的“聲學模型”和“語言模型”對用戶說話的特征向量進行統計模式識別，得到其包含的文字信息。此外，后端模塊還存在一個“自適應”的反饋模塊，可以對用戶的語音進行自學習，從而對“聲學模型”和“語音模型”進行必要的“校正”，進一步提高識別的準確率。

　　智能語音技術將在哪些領域發揮作用？

　　智能家居：找到合適的語音入口是挖掘智能家居背后用戶價值的關鍵。硬件本身具有入口價值，智能音箱、智能電視、家庭機器人等都有可能成為合適的入口。通過前端語音交互提供入口，后端互聯網提供服務的方式完成物聯網時代家居場景下的商業模式轉換。

　　智能車載：語音交互在車載場景中存在剛需，也會成為zui先爆發的領域。未來，車載設備提供商可以通過補貼用戶來搶占汽車內顯示屏市場，通過用戶用車行為數據的搜集與挖掘，為保險公司和車廠提供信息，保險公司根據數據設立分層級的保費機制，激勵規范駕駛行為。這樣，信息流和服務流將不斷在生態系統中流轉，不斷挖掘更大價值。

上一篇：對于小間距LED屏前維護究竟有何意義？

下一篇：LED顯示屏頻繁跳閘？解決竅門都在這兒

版權與免責聲明： 凡本網注明“來源：智慧城市網”的所有作品，均為浙江興旺寶明通網絡有限公司-智慧城市網合法擁有版權或有權使用的作品，未經本網授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的，應在授權范圍內使用，并注明“來源：智慧城市網m.zvwid.cn”。違反上述聲明者，本網將追究其相關法律責任。

本網轉載并注明自其它來源（非智慧城市網m.zvwid.cn）的作品，目的在于傳遞更多信息，并不代表本網贊同其觀點或和對其真實性負責，不承擔此類作品侵權行為的直接責任及連帶責任。其他媒體、網站或個人從本網轉載時，必須保留本網注明的作品第一來源，并自負版權等法律責任。