Scrapy模块爬取中华英才网招聘信息(未分页)

最新推荐文章于 2020-12-09 21:17:18 发布

6点就起床

最新推荐文章于 2020-12-09 21:17:18 发布

阅读量346

点赞数

分类专栏： python 爬虫 scrapy

本文链接：https://blog.csdn.net/ygdwb/article/details/110674297

版权

import scrapy
import time
from kjPro.items import KjproItem
class ZhhSpider(scrapy.Spider):
    name = 'zhh'
    # allowed_domains = ['www.xxx.com']
    start_urls = ['http://www.chinahr.com/channel/rizhao/']
    def parse(self, response):
        li_list=response.xpath('//*[@id="assortment_right"]/div[2]/ul/li')
        print(len(li_list))
        time.sleep(1)
        for li in li_list:
            job_name=li.xpath('./div[1]/h1/text()').extract_first()
            job_salry=li.xpath('./div[2]/span/text()').extract_first()
            # print(job_name,job_salry)
            # 实例化item对象
            ite

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

6点就起床

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Scrapy模块爬取中华英才网招聘信息(未分页)

import scrapyimport timefrom kjPro.items import KjproItemclass ZhhSpider(scrapy.Spider): name = 'zhh' # allowed_domains = ['www.xxx.com'] start_urls = ['http://www.chinahr.com/channel/rizhao/'] def parse(self, response): li_list=
复制链接

扫一扫