scrapy---网易招聘爬虫项目（旧版）

最新推荐文章于 2024-09-11 10:08:47 发布

芝士小熊饼干

最新推荐文章于 2024-09-11 10:08:47 发布

阅读量62

点赞数

文章标签： scrapy 爬虫 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_74711824/article/details/133043213

版权

import scrapy
from wangyi.items import WangyiItem


class JobSpider(scrapy.Spider):
    name = "job"
    allowed_domains = ["163.com"]
    # 修改start——urls
    start_urls = ["https://hr.163.com/api/hr163/position/queryPage"]

    # 该网站是一个JSON数据渲染的动态网页，网页源码里面并没有数据，这个地方不能直接用Xpath解析

    def parse(self, response):

        # with open('itcast.json','wb') as f:

        # f.write(response.json)

        #         提取数据
        #         获取所有职位节点列表
        node_list = response.xpath('//*[@id="p-job-list"]/div[2]/div[2]/div/div/div[2]/div/div/div[2]')
        # print(len(node_list))
        # 遍历节点列表
        for num, node in enumerate(node_list):
            # 设置过滤条件，将目标节点获取出来
            if num % 2 == 0:
                item = WangyiItem()

                item['name'] = node.xpath('').extract_first()
                # ......

                #                 .......
                yield item

        #       模拟翻页
        part_url = response.xpath("").extract__first
        #         判断终止条件
        if part_url != ' javaxxx xxx':
            next_url = response.urljoin(part_url)
            yield scrapy.Request(url=next_url, callback=self.parse)

#         模拟翻页

——————以上为大体思路

芝士小熊饼干

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

芝士小熊饼干 CSDN认证博客专家 CSDN认证企业博客

码龄2年

漳州理工职业学院

143: 原创

105万+: 周排名

6万+: 总排名

7万+: 访问

: 等级

2168: 积分

589: 粉丝

696: 获赞

20: 评论

773: 收藏

私信

关注

热门文章

分类专栏

最新评论

蓝桥杯刷题--python-1
普通网友: 文章结构严谨有条,层次分明,读起来一点也不费劲，让人受益匪浅。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
蓝桥杯刷题--python-37-分解质因数
普通网友: 每当我阅读你的编程博客文章时，我总能感受到你的专业水平和耐心解答的精神。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
最新kali关于无线网卡监听失败扫描不到wifi的解决方法
2301_79365046: 个人热点可以吗
蓝桥杯刷题--python-37-分解质因数
2301_79098686: 好文！我也写了一篇获取【大厂面试真题解析、核心开发学习笔记、最新全套讲解视频、实战项目源码讲义、学习路线简历模板】的文章
scala---补充（高级函数，隐式函数，异常，模式匹配，单词分析）
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN月度精选】榜单，全部的排名请看 https://bbs.csdn.net/topics/618030499。

大家在看

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

芝士小熊饼干 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。