从零开始的ASR(语音识别)之旅
文章目录
一、语音识别简介
语音识别技术,也被称为自动语音识别Automatic Speech Recognition,(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。
分为两部分
- 自动将人类的文字内容转换为相应的语音
- 自动将人类的语音内容转换为相应的文字
二、将文字内容转换为语音实际代码演示
这里有三种方法分别是使用pyttsx3包、win32com.client自带的Dispatch包、SpeedLib包。
1、使用pyttsx3实现文字转换成语音功能
a. 安装pyttsx3包
pip install pyttsx3 -i https://pypi