从零开始的ASR(语音识别)之旅(附项目案例程序与环境配置过程)

从零开始的ASR(语音识别)之旅

一、语音识别简介

语音识别技术,也被称为自动语音识别Automatic Speech Recognition,(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。
分为两部分

  1. 自动将人类的文字内容转换为相应的语音
  2. 自动将人类的语音内容转换为相应的文字

二、将文字内容转换为语音实际代码演示

这里有三种方法分别是使用pyttsx3包、win32com.client自带的Dispatch包、SpeedLib包。

1、使用pyttsx3实现文字转换成语音功能

a. 安装pyttsx3包

pip install pyttsx3 -i https://pypi
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

风吹落叶花飘荡

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值