Python文本转语音时处理多音字

程序员麻城东

于 2024-11-08 14:55:15 发布

阅读量475

点赞数 1

文章标签： python 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jzzoo/article/details/143625307

版权

背景是以前开发的叫号系统，最近发现了一个问题，就是多音字发音不正常。比如姓曾读成了céng，姓覃读成了tán，姓绮读成了qī ，姓缪读成了móu等等。

环境是

Windows 11 专业版
python 3.12.2
gTTS 2.5.1
pyttsx3 2.90

之前用的是pyttsx3 后面换成了gTTS ，也尝试过其他的tts引擎，问题仍然存在。示例代码如下：

import pyttsx3

engine = pyttsx3.init()  

engine.setProperty('rate', 100)  
engine.setProperty('volume', 0.8) 

engine.say("曾")  # céng
engine.say("曾小姐")  # céng
engine.say("曾思思")   # céng
engine.say("曾叶")   # céng
engine.say("曾小红")  # zēng 
engine.say("曾某某") # zēng 

engine.runAndWait()

一般在文本转语音之前，可以进行预处理，比如去除标点符号和特殊字符、文本分词、指定词库拼音等，但是对于这个问题，预处理的成本显然不小。当然可以尝试更换其他的tts引擎，或使用第三方云厂商提供的接口，方式方法都有，只是成本偏高。

所以想了一个临时的解办法，汉字不光有多音字，还有同音字。比如：曾同增，缪同庙，覃同勤等等，做一个简单的映射表，在发音之前替换一下。这个成本是最低的。如下

import pyttsx3

engine = pyttsx3.init()  

engine.setProperty('rate', 100)  
engine.setProperty('volume', 0.8) 

engine.say("增")  # zēng
engine.say("增小姐")  # zēng
engine.say("增思思")   # zēng
engine.say("增叶")   # zēng
engine.say("增小红")  # zēng 
engine.say("增某某") # zēng 

engine.runAndWait()

至此，基本就解决了。

程序员麻城东

博客等级

码龄5年

15
原创

72
点赞

89
收藏

86
粉丝

关注

私信

热门文章

分类专栏

错误统计 2篇
PHP基础 4篇
笔记 3篇
网络相关 2篇

最新评论

关于PHP和Python对PDF的处理
CSDN-Ada助手: 恭喜作者发布了关于PHP和Python对PDF处理的博客！这是一个非常有趣和实用的话题。希望作者能够继续保持创作的热情，探索更多关于PDF处理的内容。或许可以考虑深入研究其他编程语言对PDF的处理方式，或者分享一些实际案例和应用场景。期待作者的下一篇作品！愿您在写作的道路上不断进步，谦虚谨慎，积极探索。
Ubuntu apt install Failed to fetch http://security.ubuntu.com/......404 Not Found [IP: 91.xx.xx.xx]
普通网友: 优质好文，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Ubuntu apt install Failed to fetch http://security.ubuntu.com/......404 Not Found [IP: 91.xx.xx.xx]
CSDN-Ada助手: 恭喜您写了第8篇博客！看到标题里遇到了Ubuntu安装问题，或许您可以尝试通过查找更多解决方案，或者分享您的解决经验给读者，这样能够帮助更多人解决类似的问题。期待您继续创作更多有价值的内容，加油！祝您成功！
Vs Code 使用心得
CSDN-Ada助手: 不知道 CS入门技能树是否可以帮到你：https://edu.csdn.net/skill/gml?utm_source=AI_act_gml
RDS踩坑笔记
泰山AI: 在最美的年华，做最好的自己，加油！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。