初尝Python爬虫

最新推荐文章于 2023-08-30 10:03:22 发布

爱发白日梦的后端

最新推荐文章于 2023-08-30 10:03:22 发布

阅读量278

点赞数 1

文章标签： python 爬虫

本文链接：https://blog.csdn.net/liufotian/article/details/53897906

版权

第一次爬虫

使用Python爬去慕课网的课程图片

本人使用的是UBUNTU系统
使用的是Python2的版本

import re
import urllib2      #python3不能使用这个模块

#首先获取课程页面的整个源代码
req = urllib2.urlopen('http://www.imooc.com/course/list')
buf = req.read()

#其次从源代码中使用正则表达式找出所有图片的地址
listurl = re.findall(r'http:.+\.jpg',buf)

#最后把这些图片保存在当前目录中
i = 0
for url in listurl:
    f = open(str(i)+'.jpg','w')
    req = urllib2.urlopen(url)
    buf = req.read()
    f.write(buf)
    i += 1

print('DownLoad success!')