Scrapy框架第一个爬虫项目--汽车之家二手车列表信息抓取

最新推荐文章于 2023-08-03 15:54:26 发布

aodanli4826

最新推荐文章于 2023-08-03 15:54:26 发布

阅读量584

点赞数 2

文章标签： python 爬虫数据库

原文链接：http://www.cnblogs.com/tmd201304/p/9545209.html

版权

废话不多说，上代码

1、以下代码为spider文件

import scrapy
from car_home.items import che168Item

class Che168Spider(scrapy.Spider):
    name = 'che168'
    allowed_domains = ['che168.com']
    start_urls = ['https://www.che168.com/beijing/list/']
    
    def parse(self, response):
        #获取多个列表页链接，爬取多页数据
        max_page = response.xpath('//div[@id="listpagination"]/a/text()')[-1].extract()
        
        base_url = 'https://www.che168.com/beijing/a0_0msdgscncgpi1ltocsp{}exx0/'
        for i in range(1,int(max_page)+1):
            url = base_url.format(i)
            yield scrapy.Request(url,callback=

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

aodanli4826

关注关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Scrapy框架第一个爬虫项目--汽车之家二手车列表信息抓取

废话不多说，上代码1、以下代码为spider文件import scrapyfrom car_home.items import che168Itemclass Che168Spider(scrapy.Spider): name = 'che168' allowed_domains = ['che168.com'] start_urls...
复制链接

扫一扫