py读取excel时出现UnicodeDecodeError: ‘utf-16-le‘ codec can‘t decode bytes: unexpected end of data

目录

问题

解决:


问题

爬取豆瓣讨论小组内容的时候,将帖子的内容放在excel里

读取时出现了这个错误

UnicodeDecodeError: 'utf-16-le' codec can't decode bytes in position 364-365: unexpected end of data

解决:

 我尝试把那一行删除,但是依旧没用,网上搜的方法像改编码,把文件名改成xlsw,复制到新建的xlsx也都没用,最后只能换个库了(xlrd和pandas都不可以)

openpyxl这个库不能读取.xls文件

所以你需要新建一个.xlsx文件,然后将数据复制过去

import openpyxl

# 打开 Excel 文件
workbook = openpyxl.load_workbook('Data_deal.xlsx', read_only=True)

安装openpyxl库的命令

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple/ openpyxl

读取成功

简单用法 

先读取文件

import openpyxl

# 打开 Excel 文件
workbook = openpyxl.load_workbook('Data_deal.xlsx', read_only=True)

再选择工作表

# 工作表
worksheet = workbook.worksheets[0]

最后读取数据

iter_rows是按行读取,min_row是从第二行开始

iter_cols是按列读取

数据类型是元组存储,要取哪列直接拿就行,比如第五列,就row[4]

# 数据
for row in worksheet.iter_rows(min_row=2,values_only=True):
    print(type(row))

 

 

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值