1.需求:
1.1 数据采集
1、 网站解析,利用 chrome 查看网页源码,分析招聘网站网页结构。
1) “检查”招聘网站,在网页中右键点击检查,或者 F12 快捷键,进入
如下图的查看元素页面;
(示例图 1)
2) 检查网站:点击 Network、勾选 Preserve log、点击 Doc、点击清
理按钮、刷新页面、点击 Response,在 Response 查看所需内容。
(示例图 2)
2、 从招聘网站中爬取需要数据,按照要求使用 Java 或 Python 语言编写并完
善爬虫代码,爬取指定数据项,有效数据项包括但不限于:所在城市、公
司名称、薪资、技能要求等多项字段。并将代码文件与代码截图保存。
具体步骤如下:
GZ-2019032 大数据技术与应用(高职组)赛题库
- 16 -
1) 创建爬虫项目\H3CU_recruit\
2) 构建爬虫请求
3) 按要求定义相关字段
4) 获取有效数据
5ÿ