房多多scrapy爬虫实例

最新推荐文章于 2022-04-01 15:11:34 发布

weixin_43139613

最新推荐文章于 2022-04-01 15:11:34 发布

阅读量245

点赞数

分类专栏：笔记 python基础

本文链接：https://blog.csdn.net/weixin_43139613/article/details/89840999

版权

笔记同时被 2 个专栏收录

105 篇文章 1 订阅

订阅专栏

python基础

52 篇文章 0 订阅

订阅专栏

# -*- coding: utf-8 -*-
import scrapy
import os
import sys
sys.path.append("C:/Users/***/scrapy/fhdodo")
from  fhdodo.items import FhdodoItem


class FhdoSpider(scrapy.Spider):
    name = 'fhdo'
    allowed_domains = ['https://suzhou.fangdd.com/']
    start_urls = []
    host = 'https://suzhou.fangdd.com/esf-a0-a150_s1-s2_l70_x0/?pageNo={}'
    count = 1
    while count <31:
        url = host.format(str(count))
        start_urls.append(url)
        count = count+1
    def parse(self, response):
        teacher_list = response.xpath("//li[@class='LpList-item']")
        for each in teacher_list:
            item = FhdodoItem()
            whvi = each.xpath("./a/@href").extract()
            title = each.xpath("./div[@class='LpList-cont']/h4/a/span/text()").extract()
            info = each.xpath("./div[@class='LpList-cont']/p[@class='LpList-type']/text()").extract()
            addr = each.xpath("./div[@class='LpList-cont']/p[@class='LpList-address ellipsis']/a/text()").extract()
            price = each.xpath("./div[@class='LpList-cont']/div[@class='LpList-pricebox']/p/strong/text()").extract()
            up = each.xpath("./div[@class='LpList-cont']/div[@class='LpList-pricebox']/p/text()").extract()
            
            item['whvi'] = whvi[0].split()
            item['title'] = title[0].split()
            item['info0'] = info[0].split()
            item['info1'] = info[1].split()
            item['addr0'] = addr[0].split()
            item['addr1'] = addr[1].split()
            item['addr2'] = addr[2].split()
            item['price'] = price[0].split()
            item['up'] = up[1].split()
            yield item

主代码，别的都参考前一个实例

weixin_43139613

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
房多多scrapy爬虫实例

# -*- coding: utf-8 -*-import scrapyimport osimport syssys.path.append("C:/Users/zhang-peng/scrapy/fhdodo")from fhdodo.items import FhdodoItemclass FhdoSpider(scrapy.Spider): name = 'fhdo...
复制链接

扫一扫

专栏目录