制作文本爬虫

最新推荐文章于 2023-03-09 21:49:21 发布

贝贝爱豆豆

最新推荐文章于 2023-03-09 21:49:21 发布

阅读量321

点赞数

分类专栏： python学习文章标签：制作文本爬虫

本文链接：https://blog.csdn.net/YANG_Gang2017/article/details/78321649

版权

python学习专栏收录该内容

52 篇文章 1 订阅

订阅专栏

制作文本爬虫

目标网站:http://www.jikexueyuan.com/

目标内容:课程图片

实现原理:

1.保存网页源代码

2.Python读文件加载源代码

3.正则表达式提取图片网址

4.下载图片

#-*-coding:utf-8-*-

import re
import requests

#读入源代码文件
f=open('source.html','r')
html=f.read()
f.close()

#匹配图片地址
pic_url=re.findall('img src="(.*?)" class="lessonimg"',html,re.S)
i=0
for each in pic_url:
    print 'now downloading:'+each
    pic=requests.get(each)
    fp=open('pic\\'+str(i)+'.jpg','wb')
    fp.write(pic.content)
    fp.close()
    i+=1

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

贝贝爱豆豆

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
制作文本爬虫

制作文本爬虫目标网站:http://www.jikexueyuan.com/目标内容:课程图片实现原理:1.保存网页源代码2.Python读文件加载源代码3.正则表达式提取图片网址4.下载图片#-*-coding:utf-8-*-import reimport requests#读入源代码文件f=open('source.html
复制链接

扫一扫