【debug】读取xlwt生成的文件报错：codeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xd0 in position 0

最新推荐文章于 2023-02-27 16:26:39 发布

为什么昵称不能重复

最新推荐文章于 2023-02-27 16:26:39 发布

阅读量535

点赞数

分类专栏： Python编程

本文链接：https://blog.csdn.net/weixin_43298886/article/details/107370135

版权

Python编程专栏收录该内容

12 篇文章 11 订阅

订阅专栏

今天用xlwt写了一个excel表格，最后保存为csv文件：

workbook.save('Titanic.csv')

但是想从这个文件中读取数据的时候却出了问题：

data = pd.read_csv('Titanic.csv', encoding='utf-8')
print(data.head())

在这里插入图片描述
检查了一下这个文件的编码格式，发现问题：

import chardet

content_xlsx = open('Titanic.xlsx', 'rb')
content_csv = open('Titanic.csv', 'rb')
print(chardet.detect(content_csv.read()))
print(chardet.detect(content_xlsx.read()))

在这里插入图片描述
其中Titanic.xlsx和Titanic.csv都是用xlwt模块生成的，可以看到两种文件的编码应该都不是utf-8，虽然置信度只有43.5%，但也说明了一定问题。
通过调节编码方式解决这个问题应该是不行了，首先save函数只有一个参数：
在这里插入图片描述
其次我按网上说的将csv以txt格式打开然后另存为utf-8编码格式的csv文件也未成功，新文件完全打不开。
试验后发现要解决这个问题可以用以下两种方法：

改用pandas.read_excel函数读取文件，亲测可以
处理数据必然要把数据转为DataFrame格式吧，那保存的时候直接用DataFrame内置的to_csv()就好了，这样编码也不会出问题，函数参数就是文件的路径，如果文件已存在就会写入该文件，如果文件不存在就会在工作目录下新建该文件

为什么昵称不能重复

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【debug】读取xlwt生成的文件报错：codeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xd0 in position 0

今天用xlwt写了一个excel表格，最后保存为csv文件：workbook.save('Titanic.csv')但是想从这个文件中读取数据的时候却出了问题：data = pd.read_csv('Titanic.csv', encoding='utf-8')print(data.head())检查了一下这个文件的编码格式，发现问题：import chardetcontent_xlsx = open('Titanic.xlsx', 'rb')content_csv = open('
复制链接

扫一扫

专栏目录