简单的十几行代码下载某库ppt格式的内容
拒绝转载,拒绝商用,拒绝非法爬取
仅供压力巨大的中年人给孩子们找找学习资料
准备工作:
1,打开某库搜索到需要的内容,请选择PPT格式
2, 进入内容页面F12检查源代码可以看到有每个图片的链接,也是每页的链接
3, 可以用xpath或者re获取所需要的链接,或者直接copy在txt中, 我选择笨方法保存到本地的txt中
4, 然后就可以获取每个链接的图片了(成功后如下)
完整的代码如下:
```python
import re, time, os, requests
session = requests.session()
url_list = []
file = open('New Text Document.txt') #获取txt中的每个图片url
for i in file.re