PDF 文件转换为 EXCEL

社科基金立项公示文件中,立项项目分重点、一般、青年、西部四个类别,分别在四个不同PDF的文件里。

本文是在下载这四个PDF文件后,利用PYTHON将其转化为EXCEL文件,便于统计。

一、分析数据

立项类别是在文件标题里,用重点、一般等区分。

公示内容都是序号、涉及学科、课题名称、申请人、责任单位五个内容。

二、转换任务

1、将PDF表格,转换为excel表格,不同类别用不同表格记载

2、为了区分类别,在原来5列内容的基础上,增加一列’类别‘用来区分类别

3、原来的PDF每页都有表头,在excle文件里只保留一个表头

三、转换

利用 pdfplumber 读取pdf文件,利用openpyxl 写入excel表格

四、转换结果

五、简单统计 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

firefox_yau

核心程序的复用性,彩票分析

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值