利用Requests爬取图片与网页数据

最新推荐文章于 2024-07-22 17:25:13 发布

jly58fgjk

最新推荐文章于 2024-07-22 17:25:13 发布

阅读量6k

点赞数

分类专栏： python

本文链接：https://blog.csdn.net/jly58fgjk/article/details/51355289

版权

一、利用Requests爬取慕课网课程图片

网址：http://www.imooc.com/course/list?page=1

步骤分析

1、导入模块

2、抓取源代码两种方法

利用requests.get

打开一个txt文件，利用Ctrl+F查找要匹配的部分源代码，粘贴到txt文件中，在下步匹配中用到

3、根据源代码利用正则表达式对图片进行匹配

4、for循环下载图片，并把图片保存到本地文件夹下

代码如下：

#step1  导入模块
import re
import requests

#读取源代码文件
f = open('tupian5-4-2.txt','r')   ## 把网址源代码中要匹配的部分代码粘贴到这里
html = f.read()
f.close()

#匹配图片网址
pic_url = re.findall(' src="(.*?)"',html,re.S)     #和  txt中的审查元素匹配
i = 0

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

jly58fgjk

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
利用Requests爬取图片与网页数据

利用Requests爬取慕课网课程图片网址：http://www.imooc.com/course/list?page=1 步骤分析 1、导入模块 2、抓取源代码两种方法利用requests.get 打开一个txt文件，利用Ctrl+F查找要匹配的部分源代码，粘贴到txt文件中，
复制链接

扫一扫