爬虫案例01：网站图片的下载

小码菌

已于 2024-05-13 22:39:24 修改

阅读量123

点赞数 4

文章标签：爬虫前端

于 2024-05-13 22:35:01 首次发布

本文链接：https://blog.csdn.net/qq_37772593/article/details/138822649

版权

# PyQuery库 主要是用来解析网站的
import requests
from pyquery import PyQuery
# 要爬取的网站地址
url="https://pvp.qq.com/web201605/herolist.shtml"
# 获取url中的内容
html=requests.get(url).content
# print(html)
# 解析得到页面元素内容
doc=PyQuery(html)
# 定位图片所在位置，并把他转换成键值对
itmes=doc('.herolist>li').items()
print(itmes)
for item in itmes:
    # 获取图片src属性的值
    url=item.find('img').attr('src')
    print(url)
    # 重新拼接图片的地址
    urls="https:"+url
    print(urls)
    # 获取a标签的文本内容
    name=item.find('a').text()
    print(name)
    # 获取新的地址内容
    url_content=requests.get(urls).content
    # 开打路径下的文件
    with open('picture/picture'+name+'.jpg','wb')as file:
        # 写进文件的内容
        file.write(url_content)