语音识别如何处理汉字中的「同音字」现象?

outline:

1、背景

2、通俗易懂版

3、进阶版

4、多音字的处理能力

------------------------------------

1、背景

GB 2312标准共收录6763个汉字,其中一级汉字3755个,二级汉字3008个。对于人名、古汉语等方面出现的罕用字,GB 2312不能处理,这导致了后来GBK及GB 18030汉字字符集的出现。汉语的声母共有23个,韵母24个。普通话的读音共有420个左右,即使考虑声调,总数也远小于汉字的个数。

汉字中的同音字现象这里也无需多费口舌来介绍,直接呈上我国著名语言学家、“现代语言学之父”赵元任先生的两篇文章。

《施氏食狮史》

石室诗士施氏,嗜狮,誓食十狮。施氏时时适市视狮。十时,适十狮市。是时,适施氏适市。施氏视十狮,恃矢势,使是十狮逝世。氏拾是十狮尸,适石室。石室湿,施氏使侍拭石室。石室拭,施氏始试食十狮尸。食时,始识十狮实十石狮尸。试释是事。

《季姬击鸡记》

季姬寂,集鸡,鸡即棘鸡。棘鸡饥叽,季姬及箕稷济鸡。鸡既济,跻姬笈,季姬忌,急咭鸡,鸡急,继圾几,季姬急,即籍箕击鸡,箕疾击几伎,伎即齑,鸡叽集几基,季姬急极屐击鸡,鸡既殛,季姬激,即记《季姬击鸡记》。

/>

(网图,侵删)

这两篇文章通篇都是同音字,尽管只有声调的差异,但是想通畅的读下来,还是需要认真练习几遍。下面我们就来聊聊这样的同音字文章,语音识别是否可以搞定。

2、通俗易懂版

语音识别处理同音字的方法,一句话来概括就是根据上下文关系。

下面举例来说明这个过程。比如有一段语音,共有四个字,我们依次来看每个字的发音。

a)首先我们听到第一个音“wǔ”。人来判断的话,这个字的可能性也是很多的,可以是{五、午、舞、武、吾、捂}等等等等,实在不好做出选择。

b)听到第二个音之后,语音变成“wǔ·rén”的时候,选择就发生了变化。有些字开头从来没见过这种组合,所以就被排除了。现在组合可能是{五人、武人、舞人、五仁}等等等等。这个时候如果非要给出一个选择,我们可能会选择一个最常见的,比如“五人”。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值