2021-08-27-CR-002Python爬虫，用pyquery + urllib.request下载图片

最新推荐文章于 2024-04-24 15:45:08 发布

Amoor123

最新推荐文章于 2024-04-24 15:45:08 发布

阅读量177

点赞数 1

分类专栏： Python爬虫文章标签：爬虫 python

本文链接：https://blog.csdn.net/sabian2/article/details/119960907

版权

Python爬虫专栏收录该内容

26 篇文章 2 订阅

订阅专栏

爬虫下载精美图片
测试网站为：https://pic.netbian.com/4kdongwu/

from pyquery import PyQuery as  pq
import urllib.request as urq
import urllib.response
headers = {
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.61 Safari/537.36'
}


doc=pq(url='https://pic.netbian.com/4kdongwu/')
a=doc('#main ul li a ')

mylist=[]
for i  in a:
    mylist.append(i.attrib['href'])
print(mylist)

dec='https://pic.netbian.com'
addr = 'pic.netbian.com'


for  i in mylist:
    xx=pq(url=dec+i)
    # hr=xx('.photo-pic #img img')
    hr=xx('#main .photo .view .photo-pic img') #.photo .view .photo-pic
    xxy=hr.attr('src')
    name=xxy.split('/')[-1]


    #  T urllib
    request=urq.Request(dec+xxy,headers=headers)
    response=urq.urlopen(request)

    with open('vm3/'+name,'wb') as f:
        f.write(response.read())

代码的步骤是
1.设置响应头
2.用pq获取数据doc
3.将首页小图片里面的链接属性加到列表
在这里插入图片描述
这是小图片
4.针对列表里面的每个网址提取后面的大图的地址

在这里插入图片描述
这是大图片
5.取得网址后分解得到文件名
6.用urllib的request获取图片数据

7.保存图片

Amoor123

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
2021-08-27-CR-002Python爬虫，用pyquery + urllib.request下载图片

爬虫下载精美图片测试网站为：https://pic.netbian.com/4kdongwu/from pyquery import PyQuery as pqimport urllib.request as urqimport urllib.responseheaders = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4
复制链接

扫一扫