项目背景:
腾讯招聘网站是腾讯公司对外招聘的一个网站,通过对其内数据分析腾讯公司各事业群对人员的需求,以及城市分布。
数据来源:https://careers.tencent.com/search.html
提出问题:
今天是2020年12月10日,通过对该天腾讯招聘网站所有招聘信息分析腾讯对人员的需求状况。
获取数据:
使用python的request模块进行数据爬取(7574条数据)
数据预处理
查看数据信息
数据列索引
0 BGName 腾讯事业群
1 CategoryName 工作类别
2 CountryName 国家
3 LastUpdateTime 日期
4 LocationName 所在地
5 PostURL 详情url
6 ProductName 产品名称
7 RecruitPostId 招聘职位ID
8 RecruitPostName 招聘帖子名
9 Responsibility 需求能力
后续分析会用到BGName,CategoryName ,LocationName ,Responsibility
数据缺失:由上图发现 CategoryName ,LocationName 有缺失数据,网页查看发现属于正常现象,并非爬取数据出错,手动修改数据