招聘数据采集+数据清洗与分析+数据可视化

1.需求:

1.1 数据采集

1、 网站解析,利用 chrome 查看网页源码,分析招聘网站网页结构。
1) “检查”招聘网站,在网页中右键点击检查,或者 F12 快捷键,进入
如下图的查看元素页面;

(示例图 1)
2) 检查网站:点击 Network、勾选 Preserve log、点击 Doc、点击清
理按钮、刷新页面、点击 Response,在 Response 查看所需内容。


(示例图 2)
2、 从招聘网站中爬取需要数据,按照要求使用 Java 或 Python 语言编写并完
善爬虫代码,爬取指定数据项,有效数据项包括但不限于:所在城市、公
司名称、薪资、技能要求等多项字段。并将代码文件与代码截图保存。
具体步骤如下:
GZ-2019032 大数据技术与应用(高职组)赛题库
- 16 -
1) 创建爬虫项目\H3CU_recruit\
2) 构建爬虫请求
3) 按要求定义相关字段
4) 获取有效数据
5ÿ

  • 7
    点赞
  • 90
    收藏
    觉得还不错? 一键收藏
  • 5
    评论
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值