如何安装python3.8_Python3.8安装pdfminer

最新推荐文章于 2024-01-30 14:00:45 发布

weixin_39890652

最新推荐文章于 2024-01-30 14:00:45 发布

阅读量244

点赞数

文章标签：如何安装python3.8

我先说说如何正确安装这个模块！

pip3 install --upgrade setuptools

pip3 install pdfminer3k

这两个命令就可以了。

下方是安装的成功的截图，内容很多！分开截图！

730e0cf3d7ca7bcb605c4d87b0d56065f724a851.jpeg?token=51aa1343a3e2e959f065295769610d98&s=A5F26A235BEC96CC4A6D740B0000A0C2

503d269759ee3d6d55cda98c4dca66244e4ade4b.jpeg?token=59ceed4b93f767bdf03f61234015580e&s=0CE27A224BACB2CE0CD8D40E0000A0C2

Successfully installed setuptools-44.0.0

Successfully installed atomicwrites-1.3.0 attrs-19.3.0 colorama-0.4.3 more-itertools-8.0.2 packaging-20.0 pdfminer3k-1.3.1 pluggy-0.13.1 ply-3.11 py-1.8.1 pyparsing-2.4.6 pytest-5.3.2 six-1.13.0 wcwidth-0.1.8

*************************************************************************

以下是一些错误的安装方法。

pip3 install pdfminer

pip3 install pdfminer3k

21a4462309f79052163d465d7caedccc7bcbd512.jpeg?token=2e1a9c5b9a598cc495026eb4ef6ed75a

**************************************************************************现在导入相关模块，测试下

a686c9177f3e67092af8b216361b943bfadc5545.jpeg?token=3e427f019280158a9ea204ca3c961966&s=45720A62DBACB37018CD950F000080C3

没有任何提示，成功！

------------------------------------------------------------------------------

PDF格式不是一种规范格式. 尽管她被叫做"PDF文档", 但PDF并不像word或者html文档。PDF的表现更像一张图片。PDF更像是在一张纸的各个准确的位置上把内容都摆放出来。大部分情况下，没有逻辑结构，比如句子或段落，并且不能自适应页面大小的调整。PDFMiner尝试通过猜测它们的布局来重建它们的结构，但是不保证一定能工作。我知道这样很难看，但是，PDF确实不够规范。

由于PDF文件有如此大和复杂的结构，完整解析PDF文件很费时费力。好吧，大多数PDF工作中，很多模块是不需要加进来的。因此 PDFMiner 采用了一个懒惰分析的策略，就是只分析所需要的部分。解析的时候，至少需要2个核心类，PDFParser 和 PDFDocument。这两个模块配合其他模块来使用。

PDFParser 从文件中获取数据

PDFDocument 存储文档数据结构到内存中

PDFPageInterpreter 解析page内容

PDFDevice 把解析到的内容转化为你需要的东西

PDFResourceManager存储共享资源，例如字体或图片

下图显示了PDFMiner中各个类之间的关系。

d31b0ef41bd5ad6e48d77b558d1732ddb7fd3c40.jpeg?token=9bed6db18ddd6384dc84750c238c70ab&s=5A843C62218F40EB4E54D4CA0000A0B1

weixin_39890652

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
如何安装python3.8_Python3.8安装pdfminer

我先说说如何正确安装这个模块！pip3 install --upgrade setuptoolspip3 install pdfminer3k这两个命令就可以了。下方是安装的成功的截图，内容很多！分开截图！Successfully installed setuptools-44.0.0Successfully installed atomicwrites-1.3.0 attrs-19.3.0 co...
复制链接

扫一扫