爬虫爬取网页图片

最新推荐文章于 2024-08-21 16:03:12 发布

洲小洲

最新推荐文章于 2024-08-21 16:03:12 发布

阅读量300

点赞数 2

分类专栏：爬虫文章标签：爬虫 python

本文链接：https://blog.csdn.net/weixin_43907174/article/details/124461010

版权

爬虫专栏收录该内容

2 篇文章 0 订阅

订阅专栏

代码

import urllib.request
import requests
from lxml import etree
url = "https://699pic.com/tupian/fengjing.html"



def schedule(blocknum,blocksize,totalsize):
    per = 100*blocknum*blocksize/totalsize
    if per>100:
        per=100
    print('下载进度：%d'%(per))
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/99.0.4844.84 Safari/537.36'}
response = requests.get(url,headers=headers)
if response.status_code==200:
    data = response.text
    with open('.\page\img.html','w',encoding='utf-8') as w:
        w.write(data)
    html = etree.HTML(data)
    img_url = html.xpath('//img/@src')
    if len(img_url)>0:
        for index,img in enumerate(img_url):
            urllib.request.urlretrieve('http:'+img,'./images/img'+str(index)+'.jpg',schedule)
            print('--------->下载第',index,'张图片完毕')

爬取效果

在这里插入图片描述

爬取结果

在这里插入图片描述

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

洲小洲

关注关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
爬虫爬取网页图片

代码import urllib.requestimport requestsfrom lxml import etreeurl = "https://699pic.com/tupian/fengjing.html"def schedule(blocknum,blocksize,totalsize): per = 100*blocknum*blocksize/totalsize if per>100: per=100 print('下载进度：%d'
复制链接

扫一扫