简单的十几行代码爬取某库ppt格式的内容

本文介绍如何使用Python简单爬取某库中PPT格式的学习资料,通过查看页面源代码获取每个图片链接,进而下载内容。适用于为孩子寻找学习资料的家长。
摘要由CSDN通过智能技术生成

简单的十几行代码下载某库ppt格式的内容

拒绝转载,拒绝商用,拒绝非法爬取
仅供压力巨大的中年人给孩子们找找学习资料

准备工作:
1,打开某库搜索到需要的内容,请选择PPT格式
在这里插入图片描述

2, 进入内容页面F12检查源代码可以看到有每个图片的链接,也是每页的链接
在这里插入图片描述

3, 可以用xpath或者re获取所需要的链接,或者直接copy在txt中, 我选择笨方法保存到本地的txt中

4, 然后就可以获取每个链接的图片了(成功后如下)
在这里插入图片描述

完整的代码如下:

```python
import re, time, os, requests
session = requests.session()

url_list = []
file = open('New Text Document.txt')  #获取txt中的每个图片url
for i in file.re
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值