一、什么是语音识别
语音识别,通常称为自动语音识别(AutomaticSpeechRecognition,ASR),主要是将人类语音中的词汇内容转换为计算机可读的输入,一般都是可以理解的文本内容,也有可能是二进制编码或者字符序列。但是,我们一般理解的语音识别其实都是狭义的语音转文字的过程,简称 语音转文本识别(Speech-To-Text,STT)更合适,这样就能与 语音合成(Text-To-Speech,TTS)对应起来。
参考资料:
语音识别(一):简介
语音识别,通常称为自动语音识别(AutomaticSpeechRecognition,ASR),主要是将人类语音中的词汇内容转换为计算机可读的输入,一般都是可以理解的文本内容,也有可能是二进制编码或者字符序列。但是,我们一般理解的语音识别其实都是狭义的语音转文字的过程,简称 语音转文本识别(Speech-To-Text,STT)更合适,这样就能与 语音合成(Text-To-Speech,TTS)对应起来。
参考资料:
语音识别(一):简介