- 博客(2)
- 收藏
- 关注
原创 使用Python自动遍历并删除扫描PDF中的空白页
对于经常看扫描PDF资料的人来说,经常会碰到如下问题:因为一些格式转换的原因,一些空白页时不时的出现,而且规律不定,一会是偶数页码一会是奇数页码,逐个选中删除的话,对于几百页的文档,非常费时。百度搜索删除PDF空白页,得到的是一个要收费的工具,有了Python就可以利用免费开源库轻松解决。先安装 PyPDF2库,在Powershell 或CMD命令行模式安装PyPDF2流程:将空白页...
2020-02-15 20:32:47 2813 3
原创 使用pyxlsb库读取xlsb格式excel文件,转为DataFrame(详细)
.xlsb 格式是Binary格式存储的excel文件,比普通的xlsx文件的体积要小很多,在数据量极大的场景比较多用。对于这类格式,Pandas 自带的Excel库xlrt xlwt不支持,而通过pyxlsb库可以读取.xlsb文件,转为Pandas 的DataFrame后方便处理:import pyxlsb as pximport pandas as pdpath = r"D:\Spl...
2020-02-15 20:30:02 4806
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人