一、项目背景
毕业季的到来,每个大学生也引来了自己的就业问题,应该去怎样的城市,公司的融资水平,公司的规模,薪资水平,工作经验等都是每个大学生头疼的问题,为了更好的方便就业,用数据说话,本篇通过11个城市的招聘信息,从公司规模,薪资水平,工作经验分析就业选择。
二、项目介绍
本项目主要是以拉勾招聘网对11个城市的招聘信息分析,主要通过tableau和sql分析,整个项目可分为项目目的的确定,数据来源,数据处理,数据分析,问题详解,项目总结(因在python数据处理后没有重复值和缺失值)。
三、项目流程
项目目的
各城市招聘信息占比,各城市对专业和经验的敏感度,薪资水平,融资水平等。
数据来源
来自微信公众号(路人甲TM)提供的数据
数据处理
添加了一些字段(将C005和C006薪资上限和下限合并成一个字段,新建了一个实习和应届字段,新建了一个薪资上限和下限的平均值薪资(主要运用sql的case when和if函数)),将C005和C006字段隐藏。
数据可视化分析
由图可知:本数据中广州、深圳、北京、上海、杭州的公司数最多,达到1000以上,北京最多达到1900多家公司。
由图可知,由于显示问题,学历分别以不限,大专,本科,硕士排序,每个城市对本科生的需求都是极大,对于北京,对本科生的需求最大,对于广州,大专和本科生的需求接近,占比极大
由图可知,由于显示问题,经验分别以不限,应届毕业生,1-3年,3-5年,5-10年,10年以上,对于每个城市对1-3年和3-5年的需求最大,对于 北京,3-5年的需求最大,而对于广州,1-3年的需求最大。
由图可知各公司规模占比,公司规模少于15人的占比最少,仅为4.27%,15-50人,50-150人以及150-500人的公司规模占比差不多,达到20%之间。而500人-2000人的公司规模和2000人以上的公司规模占比差不多,分别为13.16%和14.73%,公司规模发展到500以上的公司是很多公司都想达到层次,也吸引更多优秀的择业者。
由图可知薪资水平分布,10-20w的招聘信息最多,有6000份招聘信息以上 ,其次是20-30w的招聘信息,而50-100w的最少,仅有19份。(PS:希望你我是其中的几位)
由图可知各发展阶段的公司数 ,其中初创型(未融资)的占比最大,达到2008,其次是上市公司,达到1789,而在上市公司以下四个层次,从成长型就开始递减,证明从成长型到上市公司需要经过不断考验最终才能登顶上市公司。
由上述仪表板可看出,对于公司编程能力需求,以JAVA占据首位,达到38.86% ,其次是PHP,占27.63%,而C#排名最低,仅为6.43%。对于影响薪资水平的因素,工作经验的增长,学历的程度上升,公司规模的增大都将促进薪资水平。
对于应届生和实习生,我制作了以下仪表板供你们对比:
问题详解
我在制作公司发展阶段对薪资影响的时候,出现了两次断层
我们取成熟型(不需要融资)和成长型(B轮)进行对比。
成熟型的平均线低于成长型,且成熟型的10-20w远高于成长型,我们有理由相信成熟型的薪资偏向10-20远大于成长型,最终得出成熟型的薪资出现断层。
对于上市公司我们取成熟型(D轮及以上)与上市公司对比
由图可知,在10-20w薪资水平中,成熟型(D轮及以上)占百分之7.75%,而上市公司占45.52%,这可能是拉低平均薪资的原因之一。
项目总结
本次项目通过拉勾招聘信息,在多个维度进行对比,提供了实行生和应届生的仪表板参考,解决了数据断层的问题,这次试验从sql到tableau,在数据处理时我发现数据处理的多个操作存在重复,是否可以做一个自动化程序解决这一问题,方便更好的数据分析呢?未来我将抽时间学习此个项目,未来更新先将经历集中在sql查询,推出sql难题板块。