1-5 语音识别 (笔记)

语音识别(笔记)

自动语音识别的定义:
语音识别技术,也被称为自动语音识别Automatic Speech Recognition,(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。
语音识别只有一个核心任务:
搜狗百科

将人类的语音转成文字

语言由单词组成

单词由音素组成

机器要做的就是:

1. 将一段声波按帧切开

2. 用帧组成状态

3. 用状态组成音素

4. 再将音素合成单词

语音就变成了文字

graph LR
语音识别应用-->声纹识别
语音识别应用-->语音合成
声纹识别-->智能音箱
语音合成-->智能音箱
声纹识别-->车载设备
语音合成-->车载设备

声纹识别:即识别说话者是谁

语音合成:即将文字信转换成人类听得懂的语音


影响语音识别的原因很简单

口音、距离、噪音都会影响语音识别的准确度

最好选个安静的环境

视频链接

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值