Python语音合成探究(二、朗读文本的编码问题)

        语音合成时,选取的朗读文本大多是网上收集来的TXT 文件,有些文件会因为编码原因打开不了,程序运行出错。

        如同样是 “离骚.txt ”文档,用 with open('离骚.txt') as file:  则提示错误:

         如换成  with open('离骚.txt',encoding='utf-8') as file: 则运行正常:

       有些文档则相反,前一行代码可以正常运行,后一行代码则提示错误。 上图中程序正常运行时边读音边出现相应文字字幕,是我在里边加入了相关代码,这个留待以后解决。

        究竟选择哪条代码,肯定是视文档编码而定。也可用代码来判断文档的编码,用if语句或try-except 来解决。

       对普通人而言,判断文档编码过于复杂,可以手工对文档转码,根据我的试验,大多可行,也有少数不行的。有时一段古文,很多段文字都可以,只要加入某段文字就会出错,估计是里面有语音“不认识”的字在里面,感觉有点玄学了。(注:现在(2023-12-29)已解决编码错误问题,详见博客《Python语音合成探究(六、朗读文本的编码终极解决)》)

      手工转码的方法,就是把TXT文档另存,在另存时选择其他编码,操作图示如下:

极域电子教室座位表程序下载链接:链接:https://pan.baidu.com/s/1X0WUTtXmr1EhFg9CNgoIKA?pwd=odvs 
提取码:odvs

考试指令系统下载链接:https://pan.baidu.com/s/11x9fS1gUEPCd6w15KHCxSw?pwd=zvw3 
提取码:zvw3 

照片插入电子表格程序链接:https://pan.baidu.com/s/1dvW5q9G53prkUDVcO6uffA?pwd=w3jp 
提取码:w3jp 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值