语音生成，语音识别基础知识

最新推荐文章于 2023-07-06 14:42:20 发布

韬光养晦气

最新推荐文章于 2023-07-06 14:42:20 发布

阅读量541

点赞数

分类专栏：语音识别

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_37805505/article/details/108420025

版权

语音识别专栏收录该内容

6 篇文章 7 订阅

订阅专栏

声学->音频->语音范围逐渐缩小

通过语谱图可以看出不同语音的特点。

OOV：Out of Vocabulary 问题

语音识别评估指标

accuracy 音素错误率，词错误率（Word Error Rate, WER）,字错误率（Character Error Rate），句错误率（Sentence Error Rate）

effciency 实时错误率（删除、插入、替换，可能会超过100%）

语音生成

浊音：声带振动，声音波形具有周期性，有稳定音高

清音：声带不振动，波形类似白噪声，无稳定音高

音素：一种语言中具有语义的最小结构单元，可以分为辅音和元音

共振峰：在声音的频谱中能量相对集中的一些区域（语谱峰值）

协同发音：音素在声学上的实现和上下文强相关

音素抄本：一段语音对应的音素列表（时间信息由人工标注或自动对齐获得），服务于语音识别声学建模

音节：元音和辅音的结合构成，比音素颗粒度更大

语音识别

信道：不同特性麦克风、不同采样率、传输编码

环境：距离衰减、噪声、混响、干扰人声

韬光养晦气

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
语音生成，语音识别基础知识

声学->音频->语音范围逐渐缩小通过语谱图可以看出不同语音的特点。OOV：Out of Vocabulary 问题语音识别评估指标accuracy 音素错误率，词错误率（Word Error Rate, WER）,字错误率（Character Error Rate），句错误率（Sentence Error Rate）effciency 实时错误率（删除、插入、替换，可能会超过100%）语音生成浊音：声带振动，声音波形具有周期性，有稳定音高清音：声带不振动，波形类
复制链接

扫一扫

专栏目录

韬光养晦气 CSDN认证博客专家 CSDN认证企业博客

码龄7年

30: 原创

14万+: 周排名

171万+: 总排名

8万+: 访问

: 等级

906: 积分

34: 粉丝

91: 获赞

19: 评论

270: 收藏

私信

关注

热门文章

分类专栏

最新评论

自步学习（Self-paced Learning）
ZIcsdn: 有没有谁交流一下自步学习。训练可不可能出现，预测结果越来越差，这样的话损失就越来越大，框架认为是难样本，反而赋予0权重，这些能够反向传播的损失就越来越小。我现在训练就遇到这样的问题，反向传播的损失为0，也就是说全认为是难样本了。
自步学习（Self-paced Learning）
缘茜行: 链接：https://www.isclab.org.cn/wp-content/uploads/2018/01/%e8%87%aa%e6%ad%a5%e5%ad%a6%e4%b9%a0-%e8%b5%b5%e6%83%9f%e8%82%96-2018-1-1-19_00_00.pdf
自步学习（Self-paced Learning）
缘茜行: 这篇文章图片和内容来源：北京理工大学信息系统及安全对抗实验中心赵惟肖硕士。如果是利用他人PPT，请不要写原创。尊重他人劳动成果。如果是本人，谢谢你的科普。
自步学习（Self-paced Learning）
qq_37622715: 很棒很清晰，感谢分享！
自步学习（Self-paced Learning）
qq_40276832: 请问算法最后的输出为什么没有v哦？这个算法的目的不就是为了确定选择哪些样本来供后续分类嘛？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。