python获取毛豆新车网在售车型

使用爬虫获取毛豆全部在售车型,目前只获取了图片的地址。

"""
功能:获取毛豆新车网的在售车型信息
作者:Mac
时间:2020.6.11
"""
import requests
import csv
from bs4 import BeautifulSoup

# 头部信息(这个站不必登陆也可以看所有车型)
headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:68.0) Gecko/20100101 Firefox/68.0"
}

# 目标链接:点击第二页,发现pg是2,第三页,pg是3......最后是17  keyword=  这个可有可无
target = "https://www.maodou.com/car/list/all/pg{}"


# 解析数据
def analy(html):
    soup = BeautifulSoup(html, "lxml")
    divs = soup.find_all("div", class_="car-photo")
    for div in divs:
        # print(div.img["alt"])   #大众朗逸 2019款 1.5L 自动舒适版 国VI
        # print(div.img["data-original"]) # 车的图片
        # 保存数据
        save(div.img)


# 保存数据
def save(datas):
    with open("MaoDouNewCars.csv", "a", newline="", encoding="utf-8-sig") as cf:
        writer = csv.writer(cf)
        # 写入一页的全部数据
        writer.writerow([datas["alt"], datas["data-original"]])


for i in range(18):  # 18 = 17 + 1
    # 1.发起请求
    response = requests.get(url=target.format(i), headers=headers)
    # 2.解析数据(此步骤包含了# 3.保存数据)
    analy(response.content.decode())

效果如图
左边代表在售的车型,右边是该车型的照片,但是效果图而已,不太好看

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值