delphi 安卓图片保存数据库_一周的工作1天干完/python+Delphi自动化记录

本文介绍了如何使用Python的PyPDF2库拆分大型PDF文件,并结合Delphi进行自动化处理,包括文本提取、文件重命名,以完成大量资料的整理工作。在遇到无法提取文本的PDF时,探讨了可能的问题和解决方案。
摘要由CSDN通过智能技术生成

刚刚结束的一个事情,仅限于完成了任务。

一、任务描述

有一个超巨型的资料性的文件,是网页上查询之后的结果,有几百页、几百笔资料,需要把里面的资料一条一条的列在一个单独立的文件里面,并且,文件用“组序号-标识-名称.pdf”来命名。

组序号由另一份Excel文件给出,每组之中有标识和名称域与超巨pdf中的相应域对应。

难点:

1、不能手工操作。不易一一对应,且不产生马虎和疏忽的错误。

2、没有长期时间。大致实测,一笔资料从信息提取、标识对应、生成新文件、按规则命名大约3分钟左右时间,1000笔资料大约50小时,每天8小时不动,大约6天,一周。一周下来,估计人也就废了。我相信这事儿没有两周干不下来。

3、不易协同作业。Excel文件规格不尽相同,且超巨pdf不便扩散,所以最好是一下子over。

二、任务分解

1、根据标识号拆分超巨pdf。这一步可以在python里用PyPDF2包完成。

2、规范Excel格式和内容。这一步在Excel里面用排序、函数和VBA足够,之后导出为csv,便于最终Delphi处理它们。

3、根据标识和名称对应并拼接资料,按标识生成单个pdf文件。由于所有资料都没有放置在数据库里,因此统一按字段当成格式文本来搜索是否有匹配。无匹配时,再巡回一次,避免标识不在指定的位置上。

三、功能片断

1、拆分超巨pdf。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值