第一次爬虫
使用Python爬去慕课网的课程图片
本人使用的是UBUNTU系统
使用的是Python2的版本
import re
import urllib2 #python3不能使用这个模块
#首先获取课程页面的整个源代码
req = urllib2.urlopen('http://www.imooc.com/course/list')
buf = req.read()
#其次从源代码中使用正则表达式找出所有图片的地址
listurl = re.findall(r'http:.+\.jpg',buf)
#最后把这些图片保存在当前目录中
i = 0
for url in listurl:
f = open(str(i)+'.jpg','w')
req = urllib2.urlopen(url)
buf = req.read()
f.write(buf)
i += 1
print('DownLoad success!')
看了之后是不是觉得使用Python爬虫也不是很难!!
所以大家努力吧!!