自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 使用Python自动遍历并删除扫描PDF中的空白页

对于经常看扫描PDF资料的人来说,经常会碰到如下问题:因为一些格式转换的原因,一些空白页时不时的出现,而且规律不定,一会是偶数页码一会是奇数页码,逐个选中删除的话,对于几百页的文档,非常费时。百度搜索删除PDF空白页,得到的是一个要收费的工具,有了Python就可以利用免费开源库轻松解决。先安装 PyPDF2库,在Powershell 或CMD命令行模式安装PyPDF2流程:将空白页...

2020-02-15 20:32:47 2624 3

原创 使用pyxlsb库读取xlsb格式excel文件,转为DataFrame(详细)

.xlsb 格式是Binary格式存储的excel文件,比普通的xlsx文件的体积要小很多,在数据量极大的场景比较多用。对于这类格式,Pandas 自带的Excel库xlrt xlwt不支持,而通过pyxlsb库可以读取.xlsb文件,转为Pandas 的DataFrame后方便处理:import pyxlsb as pximport pandas as pdpath = r"D:\Spl...

2020-02-15 20:30:02 4664

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除