Scrapy爬虫实践之搜索并获取前程无忧职位信息（基础篇）

最新推荐文章于 2024-05-01 14:35:23 发布

peng00

最新推荐文章于 2024-05-01 14:35:23 发布

阅读量6k

点赞数 1

分类专栏：网络爬虫文章标签： Scrapy 网络爬虫 Python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/peng00/article/details/48809591

版权

一、开发环境

OS：Windows 7 64bit旗舰版
Python：2.7.10
Scrapy：1.0.3
MySQL：5.6.21
Sublime Text2：2.0.2
具体的开发环境配置这里就不介绍了，如需了解，欢迎与我交流。

二、目标

通过在前程无忧的职位搜索中输入职位关键词获取相应的职位信息，现在我们通过Scrapy爬虫来实现这个功能，自动帮我们获取相关的职位信息，并保存成.json格式和保存到MySQL数据库。

三、实现步骤

Scrapy是一个比较流行的Python爬虫框架，Scrapy爬虫的基本实现流程如下：

1.通过scrapy startproject spiderproject 来创建一个新的爬虫工程，spiderproject是我们自己命名的爬虫工程。比如本例子，我们创建一个工程scrapy startproject qcwy，qcwy即为我们的工程名。

2.定义我们要解析具体数据的Item结构，在items.py文件中。

3.在pipelines.py中实现数据存储的功能，可以在这里实现我们抓取的数据保存在.json文件中，或者MySQL中，或者SQLite中，或者MongoDB中，或者其他你要保存的格式或者数据库中。

最低0.47元/天解锁文章

关注

1
点赞
踩
15

收藏

觉得还不错? 一键收藏
打赏
0
评论
Scrapy爬虫实践之搜索并获取前程无忧职位信息（基础篇）

以一个完整的实例来介绍如何实现一个Scrapy爬虫，通过爬虫搜索，并获取前程无忧上的职位信息。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

peng00 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。