1.python 获取pdf网页,首先需要知道链接,分清楚超链接和内容链接
2.安装PDFminer3k(python3.x)
深入学习python解析并读取PDF文件内容的方法
http://www.cnblogs.com/wj-1314/p/9429816.html,这个链接有python2.x 和python3.x的说明,及详情。
类似文章
https://blog.csdn.net/robolinux/article/details/43318229
https://www.jianshu.com/p/08e32ddc1dbb