【Python爬虫】Scrapy模块案例：爬取腾讯招聘网基本信息

最新推荐文章于 2023-10-30 00:00:00 发布

chibuqikendeji

最新推荐文章于 2023-10-30 00:00:00 发布

阅读量800

点赞数 2

分类专栏： Scrapy尝试 python简单爬虫文章标签： Pyhton入门到放弃爬虫 Scrapy

本文链接：https://blog.csdn.net/chibuqikendeji/article/details/82143899

版权

Scrapy模块是一个很好用的模块，功能强大。最近在学习使用scrapy模块，写了一点小东西，爬取腾讯招聘网的基本信息。

scrapy项目步骤：

1. 创建项目：scrapy startproject xxx

2. 编写items.py文件，用于设置需要保存的字段内容

3. 编写爬虫文件

4. 运行爬虫 scrapy crawl xxx

第一步：创建项目，创建完成，目录如下

第二步：编写items.py文件

列出需要获取的内容。

import scrapy

class TencentItem(scrapy.Item):
    # define the fields for your item here like:
    #职位名称
    positionname = scrapy.Field()
    #职位详情链接
    positionlink = scrapy.Field()
    #职位类别
    positiontype = scrapy.Field()
    #招聘人数
    peoplenum = scrapy.Field()
    #工作地点
    workLocation = scrapy.Field()
    #发布时间
    publishTIme = scrapy.Field()

第三步：

最低0.47元/天解锁文章

chibuqikendeji

关注

2
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
【Python爬虫】Scrapy模块案例：爬取腾讯招聘网基本信息

Scrapy模块是一个很好用的模块，功能强大。最近在学习使用scrapy模块，写了一点小东西，爬取腾讯招聘网的基本信息。scrapy项目步骤：1. 创建项目：scrapy startproject xxx2. 编写items.py文件，用于设置需要保存的字段内容3. 编写爬虫文件4. 运行爬虫 scrapy crawl xxx第一步：创建项目，创建完成，目录如下第二...
复制链接

扫一扫

专栏目录