10000访问量特别发布版本。该版本与之前版本相比,主要使用了新的提取思路。提取精度上相对有一些提升。但是程序包体积大大增加了。打开程序速度也降低了。介意的朋友请勿使用。
下载地址:链接:https://pan.baidu.com/s/1s7K8JMuix1yROZ5epm7C7w 提取码:oqhh(当链接失效或加了删除线时,表明应该有新版本了)
程序说明:
1、本程序,可以从PDF和OFD文件中提取发票字段信息。
2、本程序使用Python语言开发,使用Windows10 64打包。可运行在Windows10 64位电脑上。
3、使用到的第三方包:
1)、pdfplumber PDF文字信息提取
2)、PyMuPDF PDF转图片
3)、opencv_python PDF文件中表格信息识别处理
4)、xlrd、xlwt、xlutils Excel读取、写入、复制
5)、PyInstaller Python程序打包为exe文件
4、该程序在本人编写的部分无任何恶意代码,但不保证使用到的第三方包中也不存在恶意代码。部分软件可能会报病毒,对此有意见的话,请勿使用;也不要来问我,为啥软件报病毒。
5、源代码无技术含量,不要问我要源代码。但可以交流沟通遇到的问题、解决思路。
6、程序处理大概思路