汉语拼音音节的歧义指数

最新推荐文章于 2024-08-01 00:28:38 发布

会飞行的小蜗牛

最新推荐文章于 2024-08-01 00:28:38 发布

阅读量1.8k

点赞数 1

分类专栏：语音识别

语音识别专栏收录该内容

24 篇文章 2 订阅

订阅专栏

汉语拼音音节的歧义指数

冯志伟

如果不计声调，基本的汉语音节只有405个，这405个汉语音节可以表示全部汉字的读音。而《通用规范汉字表》包含了8105个通用汉字，在这种情况下，在一般使用中，一个汉语音节平均要表示20个以上的汉字（8,105/405 = 20.01）。

例1 在《通用规范汉字表》（2013）中，/bei/这个音节可以表示如下31个汉字：

北杯卑背椑悲碑鹎贝孛邶狈备钡倍悖被棓辈惫焙蓓碚鞁褙糒鞴鐾呗臂

例2 在《通用规范汉字表》（2013）中，/jing/这个音节可以表示如下50个汉字：

京茎泾经猄荆菁旌惊晶腈䴖睛粳兢精鲸麖鼱井阱汫刭肼颈景儆憬璥璟警劲径净迳经胫倞痉竞竟竫婧靓敬靖静境獍镜

这意味着，在表示汉字的时候，汉语拼音音节是存在歧义性的。

歧义指数是汉语拼音音节的歧义程度的数学描述。

一个汉语拼音音节的歧义指数 (I) 等于该拼音音节可以表示的汉字数 (N) 减 1。

计算公式如下：

I = N – 1

这个公式说明，如果一个拼音音节可以表示 N 个汉字，那么，它的歧义指数等于 N – 1。

如果一个拼音音节可以表示一个汉字，那么它的歧义指数为零。如果一个拼音音节可以表示两个汉字，那么，它的歧义指数为 2 – 1 = 1。如果一个拼音音节可以表示三个汉字，那么，它的歧义指数为 3 – 1 = 2. ......等等。

在上述例1中，拼音音节/bei/可以表示31个汉字，它的歧义指数为 31 – 1 = 30；在上述例2中，拼音音节/jing/可以表示50个汉字，它的歧义指数为 50 – 1 = 49。

但是，如果把单音节 /bei/和单音节/jing/结合形成一个双音节的单词 /beijing/，其歧义指数将明显地减少，因为 /beijing/ 只能表示三个双音节的单词：

例3 北京, 背景, 背静

其歧义指数减少为 3 –1 = 2。

如果把 /beijing/的第一个字母进一步大写为/Beijing/，那么，其歧义指数将减少到零：1 – 1 = 0。这说明，/Beijing/是一个没有歧义的单词，它的意思只有1个，这就是中国首都的名称：

例4 北京

因此，如果把不同的单音节的拼音音节连接成多音节的汉语单词，那么，拼音音节的歧义指数将明显地减少。这是把不同的单音节连接成为多音节的汉语单词的优越之处。

正因为汉语拼音音节存在很高的歧义指数，使用汉语拼音作为一种正规的文字是不现实的，汉语拼音永远不能取代汉字。中文的全盘拼音化只不过是一种幻想而已。

但是，在使用拼音时按照《汉语拼音正词法》进行音节连写，有助于减少拼音音节的歧义指数，可以使拼音发挥更好的作用。所以，我拥护《汉语拼音正词法》，拥护在文献工作中推广《汉语拼音正词法》。

会飞行的小蜗牛

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
汉语拼音音节的歧义指数

汉语拼音音节的歧义指数冯志伟如果不计声调，基本的汉语音节只有405个，这405个汉语音节可以表示全部汉字的读音。而《通用规范汉字表》包含了8105个通用汉字，在这种情况下，在一般使用中，一个汉语音节平均要表示20个以上的汉字（8,105/405 = 20.01）。例1 在《通用规范汉字表》（
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。