爬虫汽车之家某款特定车图片

该代码段用于从汽车之家网站下载红旗H9车型的高清外观图片。首先检查是否存在红旗H9文件夹,若不存在则创建。接着,通过requests获取网页内容,使用BeautifulSoup解析HTML并找到所有图片链接。通过判断链接中是否包含特定字符串来筛选汽车外观图片,并下载到红旗H9文件夹中。
摘要由CSDN通过智能技术生成
import os
import requests
from bs4 import BeautifulSoup#导入模块

if not os.path.exists('./红旗H9'):
    os.mkdir('./红旗H9')#如果没有红旗H9文件就创建一个红旗H9文件

url = "https://car.autohome.com.cn/photolist/series/5566/1/p1/?pvareaid=101197"
response = requests.get(url=url).text#发送网页请求

soup = BeautifulSoup(response,'lxml')#解析网页
img_lists = soup.findAll("img")#寻找网页所有img标签
#进行遍历
for img_list in img_lists:
    img_url1 = img_list.get("src")#获取img标签中的src标签
    img_url2 = img_list.get("src2")#获取img标签中的src2标签
    img_urls = ""
    #print(img_url1)
    #进行判断,取出汽车外观图片
    if "_autohomecar__" in str(img_url1):
        img_urls = img_url1
    if "_autohomecar__" in str(img_url2):
        img_urls = img_url2

    big_img_urls = img_urls.replace("240x180_0_q95_c42_", "")#图片网址小尺寸比例去掉,
    img_src = "https:" + big_img_urls#拼接成完整的图片地址

    img_name = img_src.split('/')[-1]#切片命名
    img_data = requests.get(url=img_src).content#请求图片数据
    img_path = '红旗H9/' + img_name#路径
    #下载高清图片
    with open(img_path,'wb') as fp:
        fp.write(img_data)
        print(img_name,"下载完成")

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值