用python爬虫批量下载pdf

最新推荐文章于 2024-07-10 03:26:35 发布

WittyLu

最新推荐文章于 2024-07-10 03:26:35 发布

阅读量5.1w

点赞数 16

分类专栏： python 文章标签： python 爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/baidu_28479651/article/details/76158051

版权

本文介绍如何使用Python爬虫从Excel文件中提取500多个PDF下载链接并进行批量下载，通过参考多个教程并调整代码以适配Python 3.5环境，最终成功实现自动化下载。

摘要由CSDN通过智能技术生成

今天遇到一个任务，给一个excel文件，里面有500多个pdf文件的下载链接，需要把这些文件全部下载下来。我知道用python爬虫可以批量下载，不过之前没有接触过。今天下午找了下资料，终于成功搞定，免去了手动下载的烦恼。

我参考了以下资料，这对我很有帮助：
1、廖雪峰python教程
2、用Python 爬虫批量下载PDF文档 http://blog.csdn.net/u012705410/article/details/47708031
3、用Python 爬虫爬取贴吧图片 http://blog.csdn.net/u012705410/article/details/47685417
4、Python爬虫学习系列教程 http://cuiqingcai.com/1052.html

由于我搭建的python版本是3.5，我学习了上面列举的参考文献2中的代码，这里的版本为2.7，有些语法已经不适用了。我修正了部分语法，如下：


# coding = UTF-8
# 爬取李东风PDF文档,网址：http://www.math.pku.edu.cn/teachers/lidf/docs/textrick/index.htm

import urllib.request
import re
import os

最低0.47元/天解锁文章

关注

16
点赞
踩
143

收藏

觉得还不错? 一键收藏
5
评论
用python爬虫批量下载pdf

今天老板给了一个excel文件，里面有500多个pdf文件的下载链接。解决方法：用python爬虫批量下载
复制链接

扫一扫

专栏目录

博客等级

码龄9年

63
原创

151
点赞

258
收藏

58
粉丝

关注

私信

热门文章

分类专栏

css 3篇
js 25篇
Java 8篇
android 7篇
数据库 3篇
nodejs 3篇
gulp 1篇
matlab 3篇
word 1篇
webstorm
markdown语法 2篇
前端面试 8篇
编程题 8篇
python 1篇

最新评论

android 图片点击一下就放大到全屏,再点一下就回到原界面
CourserLi: xiaoyua是你需要放大的图片
SequelizeAccessDeniedError的原因和解决方式
小李杜: 哥，我爱你
word公式对齐小技巧
追风·星尘: 是按下shift和7（该按键在键盘上是一个7，同时7的上面还有一个&符号）。不过要在该行完全被选定的情况下才行哦。可把鼠标光标点到第一个字母后面，然后在用键盘上的左箭头来移动光标，当移动两次的时候应该就会出现整行被选定的状态了，此时按下shift+7就能实现左对齐了。
word公式对齐小技巧
嗯哼自信点: 你好，在每个等式前面打上&符号，就是左对齐。如果想右对齐，那就在每一个等式后面打上&符号。直接输入&吗，我这还是不对呀
鼠标点击 INPUT 元素后默认触发的事件执行顺序
Tisfy: 将唐风宋骨发扬得入木三分

最新文章

目录

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。