获取当前页面下的车型的 表显里程 等数据
结果如下:
直接讲代码实现
代码实现基本分四步
1.发送请求
2.获取数据
3.解析数据
4.保存数据
1.发送请求
import requests
url ='https://www.XXX.com/china/list/'
2.获取数据
#header 和cookies 数据直接F12里的数据粘贴过来
response = requests.get('https://www.XXX.com/china/list/', cookies=cookies, headers=headers)
html_data = response.text
用network定位后发现,都是静态网页,所以要用到xpath模块
import parsel
select =parsel.Selector(html_data)
这里要获得车型的网址,经过定位后,用正则取出来网址
//ul[@class="viewlist_ul"]/li/a[@class="carinfo"]/@hr