python网络爬虫&&爬取图片

最新推荐文章于 2022-07-08 11:20:38 发布

weixin_30677073

最新推荐文章于 2022-07-08 11:20:38 发布

阅读量102

点赞数

文章标签： python 爬虫

原文链接：http://www.cnblogs.com/aloneindefeat/p/10654886.html

版权


爬取学院官网数据
from urllib.request import * #导入所有request   urllib文件夹，request只是里面的一个模块
from lxml import etree  #导入lxml包
import time
url="http://www.llhc.edu.cn/"  #爬取的地址
# print(url)
with urlopen(url) as html:
    text= html.read().decode('utf-8')# 对html读取、解码
doc=etree.HTML(text)   #解析html文档
links=doc.xpath("//div[contains(@class,'pic')]/ul/li/div/img/@src")#获取数据
# print(len(links))
#下载资源 可以是视频音频
for i in range(len(links)):
    # print(i)
    time.sleep(2)
    print('正在下载第%s个'%i)
    urlretrieve('http://www.llhc.edu.cn/'+links[i],'imgs/%s.jpg'%i) #将图片地址下载到指定目录

转载于:https://www.cnblogs.com/aloneindefeat/p/10654886.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_30677073

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python网络爬虫&&爬取图片

爬取学院官网数据from urllib.request import * #导入所有request urllib文件夹，request只是里面的一个模块from lxml import etree #导入lxml包import timeurl="http://www.llhc.edu.cn/" #爬取的地址# print(url)with urlopen(url) as html: ...
复制链接

扫一扫