1.在处理一批txt数据的时候,遇到问题:使用with open()的方法打开文件并进行readlines()的操作的时候会报错(因为歌词文本包含中英文日语还有一些其他符号),因为有的文件要使用encoding=‘utf-8’,有的文件要使用encoding=‘gbk’,所以使用try-except模块的方法,try:encoding='utf-8’报错就进行异常处理except:encoding=‘gbk’,这样就可以在一个循环里读取所有的文件了。
2.上述报错的原因可能和字符无关,和文件实际的编码方式有关,with里面的encoding是声明的编码方式,文件的实际编码方式可能和声明的不一样。这和文本文件的保存方式可能有关,比如可以参考https://blog.csdn.net/qq_42804736/article/details/89576446
python文件处理——encoding参数,utf-8,gbk
最新推荐文章于 2024-05-22 20:26:52 发布