智能音箱工作原理
→1、识别人说的话(ASR
,Automatic Speech Recognition 自动语音识别技术)
→2、对识别的内容提取信息并处理(NLP
,Natural Language Processing自然语言处理 )
→3、把处理结果发出声音给人(TTS
,TextToSpeech 从文本到语音技术)
下面对三步流程中的技术的ASR、NLP、TTS做下概念普及
-
ASR:自动语音识别技术(Automatic Speech Recognition)是一种将人的语音转换为文本的技术。语音识别系统的性能大致取决于以下4类因素:
-
识别词汇表的大小和语音的复杂性
-
语音信号的质量
-
单个说话人还是多说话人
-
硬件
-
-
NLP: 自然语言处理(NLP,Natural Language Processing) 是研究人与计算机交互的语言问题的一门学科一方面它是语言信息处理的一个分支,另一方面它是人工智能(AI, Artificial Intelligence)的核心课题之一。
按照技术实现难度的不同,这类系统可以分成简单匹配式、模糊匹配式和段