语音识别 --字典

最新推荐文章于 2023-11-26 00:52:03 发布

一步两步三步ing

最新推荐文章于 2023-11-26 00:52:03 发布

阅读量2.5k

点赞数

分类专栏：语音识别文章标签：语音识别字典

语音识别专栏收录该内容

2 篇文章 0 订阅

订阅专栏

1. 概念：

语音识别中的字典也被称为发音字典，顾名思义就是用来描述各个词的发音或者说给出各个词和音素之间的关系；

2.作用：

语音识别系统中所有词的结果均出自于字典，也就是说他是识别系统处理词和音素的集合；通过发音字典得到声学模型的建模单元和语言模型建模单元间的映射关系，从而把声学模型和语言模型连接起来，组成一个搜索的状态空间用于解码器进行解码工作；

3.制作：

以中文识别为例：
step 1：
首先需要确定的是拼音到音素的转换规则/映射关系。
可以有不同的映射关系，如汉字一的拼音 “yi1”可以对应 “ii i1”，也可以对应 “y i1”（前者是清华语音识别使用的规则）。
不同的映射关系会产生不同的识别效果。
step 2：
需要列出尽可能多的中文词及其对应的拼音，有多音字的可列出其不同组合。
step 3：
通过以上两个步骤即可实现中文词-音素的转换，也就是G2P（Grapheme-to-Phoneme Conversion）。
通过脚本可实现输入中文词，输出对应音素的功能。

4.参考文献：
What is G2P? http://www.voxforge.org/home/docs/faq/faq/what-is-g2p

一步两步三步ing

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
语音识别 --字典

1. 概念：语音识别中的字典也被称为发音字典，顾名思义就是用来描述各个词的发音或者说给出各个词和音素之间的关系；2.作用：语音识别系统中所有词的结果均出自于字典，也就是说他是识别系统处理词和音素的集合；通过发音字典得到声学模型的建模单元和语言模型建模单元间的映射关系，从而把声学模型和语言模型连接起来，组成一个搜索的状态空间用于解码器进行解码工作；3.制作：以中文识别为例：step 1：...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。