使用scrapy+mysql爬取拉勾网移动端页面

最新推荐文章于 2021-01-19 03:56:37 发布

hcolde

最新推荐文章于 2021-01-19 03:56:37 发布

阅读量531

点赞数

分类专栏： Scrapy

本文链接：https://blog.csdn.net/hcolde/article/details/80696841

版权

本文介绍了如何使用Scrapy和MySQL爬取并存储拉勾网移动端的职位信息。首先，详细解析了搜索职位页面的参数和返回数据，接着探讨了职位详情页面的数据处理和数据库操作。最后，提到了结果展示和多线程在数据存取中的应用。

摘要由CSDN通过智能技术生成

@hcolde 字数 4061

Python3.6

virtualenv ( pip install virtualenv )

Scrapy ( pip install Scrapy )

PyMySQL ( pip install pymysql )

Mysql服务器

cmd-markdown-logo

pageSize 每页显示多少个职位信息。 ( json->content->data->page->pageSize )
totalCount 总共有多少个职位。 ( json->content->data->page->totalCount )
positionId 职位id，打开职位详情页面需要的参数，返回的类型为int型。 ( json->content->data->page->result[]->positionId )

根据pageSize和totalCount可计算需要爬取多少个页面，代码如下：

关注