一、利用Requests爬取慕课网课程图片
网址:http://www.imooc.com/course/list?page=1
步骤分析
1、导入模块
2、抓取源代码 两种方法
利用requests.get
打开一个txt文件,利用Ctrl+F查找要匹配的部分源代码,粘贴到txt文件中,在下步匹配中用到
3、根据源代码利用正则表达式对图片进行匹配
4、for循环下载图片,并把图片保存到本地文件夹下
代码如下:
#step1 导入模块
import re
import requests
#读取源代码文件
f = open('tupian5-4-2.txt','r') ## 把网址源代码中要匹配的部分代码粘贴到这里
html = f.read()
f.close()
#匹配图片网址
pic_url = re.findall(' src="(.*?)"',html,re.S) #和 txt中的审查元素匹配
i = 0