Python读取包含中文字符文件时报错

最新推荐文章于 2023-04-12 18:00:07 发布

python5915

最新推荐文章于 2023-04-12 18:00:07 发布

阅读量3.7k

点赞数 1

分类专栏： Python 文章标签： python gbkcodec

本文链接：https://blog.csdn.net/chuan_day/article/details/72582242

版权

当Python尝试用GBK编码读取包含中文字符的文件时，会报错'gbk codec can't decode byte 0x8a in position 87: illegal multibyte sequence'。为解决此问题，可以使用open函数的encoding参数指定UTF-8编码来读取文件，如：`open(path,'r',encoding='UTF-8')`。但这样做可能会导致输出的行间距与源文件不一致。可以使用`line.strip()`去除行尾的空白字符，保持源文件的原始间距。" 125691718,14598774,C语言基础学习：程序设计与实践,"['C语言', '编程基础', '程序设计', '计算机语言']

摘要由CSDN通过智能技术生成

Python读取包含中文字符文件时报错gbk' codec can't decode byte 0x8a in position 87: illegal multibyte sequence

读取包含中文文件时报错，如题：

read3.py

#----coding:utf-8-----
def read1(path):
for line in open(path,'r'):
print(line)

if __name__ == '__main__':
path = r'D:\IStudy\Java\workspace\mypy\com\dgb\test\2017-05-10.txt'
read1(path)

执行后报了如题的错误，查看文档open方法还有参数，decode，修改文件后：

#----coding:utf-8-----
def read1(path):
for line in open(path,'r',encoding='UTF-8'):
print(line)

if __name__ == '__main__':
path = r'D:\IStudy\Java\workspace\mypy\com\dgb\test\2017-05-10.txt'
read1(path)

文件时正常输出了，但是行与行之间的间距明显与源文件的间距不一致，python对于st

最低0.47元/天解锁文章

python5915

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Python读取包含中文字符文件时报错

Python读取包含中文字符文件时报错gbk' codec can't decode byte 0x8a in position 87: illegal multibyte sequence读取包含中文文件时报错，如题：read3.py#----coding:utf-8-----def read1(path): for line in open(path,'r')
复制链接

扫一扫