# PyQuery库 主要是用来解析网站的
import requests
from pyquery import PyQuery
# 要爬取的网站地址
url="https://pvp.qq.com/web201605/herolist.shtml"
# 获取url中的内容
html=requests.get(url).content
# print(html)
# 解析得到页面元素内容
doc=PyQuery(html)
# 定位图片所在位置,并把他转换成键值对
itmes=doc('.herolist>li').items()
print(itmes)
for item in itmes:
# 获取图片src属性的值
url=item.find('img').attr('src')
print(url)
# 重新拼接图片的地址
urls="https:"+url
print(urls)
# 获取a标签的文本内容
name=item.find('a').text()
print(name)
# 获取新的地址内容
url_content=requests.get(urls).content
# 开打路径下的文件
with open('picture/picture'+name+'.jpg','wb')as file:
# 写进文件的内容
file.write(url_content)
爬虫案例01:网站图片的下载
于 2024-05-13 22:35:01 首次发布