Python语音合成探究（二、朗读文本的编码问题）

老菜鸟YDZ

已于 2024-08-06 17:06:41 修改

阅读量252

点赞数 1

分类专栏：菜鸟学python 文章标签： python 语音识别人工智能青少年编程神经网络机器学习

于 2022-12-09 09:08:43 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_60659514/article/details/128236950

版权

菜鸟学python 专栏收录该内容

21 篇文章 6 订阅

订阅专栏

语音合成时，选取的朗读文本大多是网上收集来的TXT 文件，有些文件会因为编码原因打开不了，程序运行出错。

如同样是 “离骚.txt ”文档，用 with open('离骚.txt') as file: 则提示错误：

如换成 with open('离骚.txt',encoding='utf-8') as file: 则运行正常：

有些文档则相反，前一行代码可以正常运行，后一行代码则提示错误。上图中程序正常运行时边读音边出现相应文字字幕，是我在里边加入了相关代码，这个留待以后解决。

究竟选择哪条代码，肯定是视文档编码而定。也可用代码来判断文档的编码，用if语句或try-except 来解决。

对普通人而言，判断文档编码过于复杂，可以手工对文档转码，根据我的试验，大多可行，也有少数不行的。有时一段古文，很多段文字都可以，只要加入某段文字就会出错，估计是里面有语音“不认识”的字在里面，感觉有点玄学了。（注：现在（2023-12-29）已解决编码错误问题，详见博客《Python语音合成探究（六、朗读文本的编码终极解决）》）

手工转码的方法，就是把TXT文档另存，在另存时选择其他编码，操作图示如下：

极域电子教室座位表程序下载链接：链接：https://pan.baidu.com/s/1X0WUTtXmr1EhFg9CNgoIKA?pwd=odvs
提取码：odvs

考试指令系统下载链接：https://pan.baidu.com/s/11x9fS1gUEPCd6w15KHCxSw?pwd=zvw3
提取码：zvw3

照片插入电子表格程序链接：https://pan.baidu.com/s/1dvW5q9G53prkUDVcO6uffA?pwd=w3jp
提取码：w3jp

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。