拉勾招聘数据分析

最新推荐文章于 2023-11-28 09:58:56 发布

辣梨的分析屋

最新推荐文章于 2023-11-28 09:58:56 发布

阅读量1k

点赞数 1

分类专栏：数据分析 sql tableau 文章标签： sql 数据分析

本文链接：https://blog.csdn.net/weixin_52509748/article/details/119972641

版权

数据分析同时被 3 个专栏收录

8 篇文章 1 订阅

订阅专栏

sql

3 篇文章 0 订阅

订阅专栏

tableau

3 篇文章 0 订阅

订阅专栏

一、项目背景

毕业季的到来，每个大学生也引来了自己的就业问题，应该去怎样的城市，公司的融资水平，公司的规模，薪资水平，工作经验等都是每个大学生头疼的问题，为了更好的方便就业，用数据说话，本篇通过11个城市的招聘信息，从公司规模，薪资水平，工作经验分析就业选择。

二、项目介绍

本项目主要是以拉勾招聘网对11个城市的招聘信息分析，主要通过tableau和sql分析，整个项目可分为项目目的的确定，数据来源，数据处理，数据分析，问题详解，项目总结（因在python数据处理后没有重复值和缺失值）。

三、项目流程

项目目的

各城市招聘信息占比，各城市对专业和经验的敏感度，薪资水平，融资水平等。

数据来源

来自微信公众号（路人甲TM）提供的数据

数据处理

添加了一些字段（将C005和C006薪资上限和下限合并成一个字段，新建了一个实习和应届字段，新建了一个薪资上限和下限的平均值薪资（主要运用sql的case when和if函数）），将C005和C006字段隐藏。

数据可视化分析

由图可知：本数据中广州、深圳、北京、上海、杭州的公司数最多，达到1000以上，北京最多达到1900多家公司。

由图可知，由于显示问题，学历分别以不限，大专，本科，硕士排序，每个城市对本科生的需求都是极大，对于北京，对本科生的需求最大，对于广州，大专和本科生的需求接近，占比极大

由图可知，由于显示问题，经验分别以不限，应届毕业生，1-3年，3-5年，5-10年，10年以上，对于每个城市对1-3年和3-5年的需求最大，对于北京，3-5年的需求最大，而对于广州，1-3年的需求最大。

由图可知各公司规模占比，公司规模少于15人的占比最少，仅为4.27%，15-50人，50-150人以及150-500人的公司规模占比差不多，达到20%之间。而500人-2000人的公司规模和2000人以上的公司规模占比差不多，分别为13.16%和14.73%,公司规模发展到500以上的公司是很多公司都想达到层次，也吸引更多优秀的择业者。

由图可知薪资水平分布，10-20w的招聘信息最多，有6000份招聘信息以上，其次是20-30w的招聘信息，而50-100w的最少，仅有19份。（PS：希望你我是其中的几位）

由图可知各发展阶段的公司数，其中初创型（未融资）的占比最大，达到2008，其次是上市公司，达到1789，而在上市公司以下四个层次，从成长型就开始递减，证明从成长型到上市公司需要经过不断考验最终才能登顶上市公司。

由上述仪表板可看出，对于公司编程能力需求，以JAVA占据首位，达到38.86% ，其次是PHP，占27.63%，而C#排名最低，仅为6.43%。对于影响薪资水平的因素，工作经验的增长，学历的程度上升，公司规模的增大都将促进薪资水平。

对于应届生和实习生，我制作了以下仪表板供你们对比：

问题详解

我在制作公司发展阶段对薪资影响的时候，出现了两次断层

我们取成熟型（不需要融资）和成长型（B轮）进行对比。

成熟型的平均线低于成长型，且成熟型的10-20w远高于成长型，我们有理由相信成熟型的薪资偏向10-20远大于成长型，最终得出成熟型的薪资出现断层。

对于上市公司我们取成熟型（D轮及以上）与上市公司对比

由图可知，在10-20w薪资水平中，成熟型（D轮及以上）占百分之7.75%，而上市公司占45.52%，这可能是拉低平均薪资的原因之一。

项目总结

本次项目通过拉勾招聘信息，在多个维度进行对比，提供了实行生和应届生的仪表板参考，解决了数据断层的问题，这次试验从sql到tableau，在数据处理时我发现数据处理的多个操作存在重复，是否可以做一个自动化程序解决这一问题，方便更好的数据分析呢？未来我将抽时间学习此个项目，未来更新先将经历集中在sql查询，推出sql难题板块。