python excel表格信息处理

在使用openpyxl处理大型Excel表格时,应避免使用行列地址随机访问单元格,因其速度随距离增加而变慢。推荐使用iter_rows和iter_cols方法,能显著提高效率。另外,遇到IllegalCharacterError错误,可使用正则表达式移除ASCII表中的非法字符。
摘要由CSDN通过智能技术生成

使用openpyxl库时:

使用Excel风格的行列地址随机访问单元格时,其内部还是从头逐个匹配,越远的单元格速度越慢,对于大表格不建议使用;

正确姿势是调用iter_rows、iter_cols方法,再去提取想要的单元格,速度飞快,比应用行列地址随机访问速度快了几个数量级。

openpyxl.utils.exceptions.IllegalCharacterError 错误

原因:

识别到非法字符都是八进制,对应到ASCII表中,都是不常见的不可显示字符。例如退格,响铃等,在此处被定义为excel中的非法字符。

解决:

(将非法字符去掉)

ILLEGAL_CHARACTERS_RE = re.compile(r'[\000-\010]|[\013-\014]|[\016-\037]')

text= ILLEGAL_CHARACTERS_RE.sub(r'', text)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值