python爬取汽车之家图片_python爬取汽车之家汽车数据

该博客介绍了一个使用Python爬虫从汽车之家网站抓取汽车品牌、车型、价格和销售状态的方法。通过BeautifulSoup解析HTML,将数据保存到Excel文件中。爬虫遍历了所有品牌和在售、即将销售、停售的车型URL,抓取对应信息。
摘要由CSDN通过智能技术生成

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有帐号?立即注册

x

# -- coding: utf-8 --

'''

Created on 2018年08月07日

@author: huyw

'''

from bs4 import BeautifulSoup

import datetime

import urllib.request, urllib.parse, http.cookiejar

import xlsxwriter

# 定义解析网页函数

def getHtml(url):

cj=http.cookiejar.CookieJar()

opener=urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cj))

# 伪装成浏览器,虽然并没啥卵用

opener.addheaders=[('User-Agent','Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.101 Safari/537.36'),('Cookie','4564564564564564565646540')]

urllib.request.install_opener(opener)

html_string = urllib.request.urlopen( url ).read()

return html_str

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值