上周,百度宣布語音技術全系列接口*免費開放,提供語音識別、語音合成、語音喚醒多平臺SDK (軟件開發工具包),支持和合作伙伴。語音交互是人與機器“交流”的重要環節,百度宣布語音技術全系列接口*免費,或將帶來一場巨大的行業變革。
智能語音技術是人工智能產業鏈上的關鍵一環。人工智能產業鏈主要分為三個層次。底層是基礎設施,包括芯片、模組、傳感器,以及大數據平臺、云計算服務和網絡運營商;中間層是基礎技術研究和服務提供商,包括深度學習、計算機視覺、語音技術和自然語言處理以及機器人等領域;上層是行業應用,包括智能家居、可穿戴設備、無人駕駛、虛擬助理、家庭機器人等。
語音識別技術原理是什么?
語音識別系統構建過程整體上包括兩大部分:訓練和識別。訓練是指對預先收集好的語音進行信號處理和知識挖掘,獲取語音識別系統所需要的“聲學模型”和“語言模型”;識別是對用戶實時語音進行自動識別。識別過程通常又可以分為“前端”和“后端”兩大模塊:“前端”主要作用是進行端點檢測(去除多余的*和非說話聲)、降噪、特征提取等;“后端”作用是利用訓練好的“聲學模型”和“語言模型”對用戶說話的特征向量進行統計模式識別,得到其包含的文字信息。此外,后端模塊還存在一個“自適應”的反饋模塊,可以對用戶的語音進行自學習,從而對“聲學模型”和“語音模型”進行必要的“校正”,進一步提高識別的準確率。
智能語音技術將在哪些領域發揮作用?
智能家居:找到合適的語音入口是挖掘智能家居背后用戶價值的關鍵。硬件本身具有入口價值,智能音箱、智能電視、家庭機器人等都有可能成為合適的入口。通過前端語音交互提供入口,后端互聯網提供服務的方式完成物聯網時代家居場景下的商業模式轉換。
智能車載:語音交互在車載場景中存在剛需,也會成為zui先爆發的領域。未來,車載設備提供商可以通過補貼用戶來搶占汽車內顯示屏市場,通過用戶用車行為數據的搜集與挖掘,為保險公司和車廠提供信息,保險公司根據數據設立分層級的保費機制,激勵規范駕駛行為。這樣,信息流和服務流將不斷在生態系統中流轉,不斷挖掘更大價值。