語音識別(AutomaticSpeechRecognition)是以语音为研究对象,通过信号处理和识别技术让机器自动识别和理解人类口述的语言后,将语音信号转换为相应的文本或命令的一门技术。由語音識別和语音合成、自然語言理解、语义网络等技术相结合的语音交互正在逐步成为当前多通道、多媒体智能人机交互的主要方式。
1. 語音識別的流程
語音信號經過前端信號處理、端點檢測等預處理後,逐幀提取語音特征,傳統的特征類型包括有MFCC、PLP、FBANK等特征,提取好的特征會送到解碼器,在訓練好的聲學模型、語言模型之下,找到最爲匹配的此序列作爲識別結果輸出。
2. 分形科技解决方案中对語音識別的应用
北京分形科技在智慧公園解決方案中应用了語音識別的技术,如智能語音亭解决方案、智能家居解决方案。
智能語音亭:智能語音亭借助了語音交互、自然語言處理,聊天技能。能夠讓亭子陪公衆聊天,聽歌,聽戲,聽相聲;查詢天氣,交通,股票信息;聽兒歌、講故事、學知識等等,讓文物會說話了。
智能家居控制:通過語音控制和物聯網技術實現了窗簾自動打開、關閉;燈光的打開,關閉和亮度調節;電視的打開,關閉等。以及聯動控制公衆可通過語音控制比如說“我回來了”,智能家居可以自動關閉窗簾,自動打開燈,自動打開電視。感受人工智能帶來的生活便利。