scrapy爬虫日志_2:[爬取智联招聘]

最新推荐文章于 2021-09-29 17:02:00 发布

可以调素琴

最新推荐文章于 2021-09-29 17:02:00 发布

阅读量411

点赞数

分类专栏：爬虫文章标签： scrapy爬虫

本文链接：https://blog.csdn.net/NewDreamstyle/article/details/90111600

版权

在使用Scrapy爬取智联招聘网站时遇到Item报错，通过在Item中添加_id字段解决了问题。最终成功将数据存入数据库，但发现爬取的工资数据偏低。同时推荐了网易云课程进行爬虫学习。

摘要由CSDN通过智能技术生成

问题

1,item 报错如下图
在这里插入图片描述
具体原因不去追究【实在没工夫，这框架先用着，，，，】，解决方案：在item中追加_id

代码

这个是spider板块即主体部分：***主要思路是先转为json文件，然后对json文件进行解析得到链接，再对链接进行分析爬取
Chrome打开网页->检查->network->XHR->复制Request-url  在postman（一个软件）打开即可分析json***

import scrapy
import json
from ..items import JobsItem

class NewZhilianSpider(scrapy.Spider):
    name = 'new_zhilian'
    allowed_domains = ['zhaopin.com']
    url = ['https://fe-api.zhaopin.com/c/i/sou?start={}&pageSize=90&cityId=538&salary=0,0&workExperience=-1&education=-1&companyType=-1&employmentType=-1

最低0.47元/天解锁文章

可以调素琴

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
scrapy爬虫日志_2:[爬取智联招聘]

问题1,item 报错如下图具体原因不去追究【实在没工夫，这框架先用着，，，，】，解决方案：在item中追加_id代码这个是spider板块即主体部分：***主要思路是先转为json文件，然后对json文件进行解析得到链接，再对链接进行分析爬取Chrome打开网页->检查->network->XHR->复制Request-url 在postman（一个软件...
复制链接

扫一扫

专栏目录