一、分析背景和目的
本人最近要做数据分析实战项目,想通过此次分析筛选出最常用的工具软件。
二、分析框架和思路
- 获取招聘网站相关信息:通过后裔采集器爬取本地数据分析岗位基本信息。
- 提取出关键信息进行分析:通过excel整理并筛选出出现频次最高的相关关键词。
三、分析正文
- 获取数据:利用后裔采集器采集目标网站信息
提取后如下图
2.数据处理和数据清洗
将上表进行如下处理:
- 分列并重定义列名
- 用trim和clean函数整理格式
- 用right和len函数去掉列与列间的重复信息
- 用len和substitute函数新增自己需要的列
- 用OFFlSET(A$2,INT((ROW(A1)-1)/8),MOD(ROW(A1)-1,8))公式将所有所需技能合并成一列,并用数据中去掉重复值选项对列进行去重,这样就得到所有需要的技能名。
- 通过行列转置将这些关键词复制成为列名,并通过如下函数IF(ISNUMBER(SEARCH(P
1
,
1,
1,O2)),1,"")将每家公司需要的技能有序整理如下图
3.建模分析
- 新建辅助表,通过subtotal函数得到各列求和值。
- 新建第二张辅助表,将第一张辅助表列名行列转置,并通过setoff函数将公式赋给新表,根据此表插入柱状图。
至此,简单的数据看板建立完成,通过筛选主表数据,可以得到任何想要的数据和图形。
- 整体看哪些工具和技能被要求的次数最多?
- 顺便分析几种其他情况
四、结论及建议
- 观察以上图表不难看出,“数据分析”和“python”无论在何种情况下都排在前两位。
- 初级岗位要求excel较多,但随着公司规模和薪资增加,排名逐渐靠后,可视化、数据挖掘等相对占比增高。
- 综上,针对于此次分析的时间节点及覆盖区域得出如下结论:对于想转行初级岗位的朋友,我们要不断增强数据分析思维,掌握excel的相关技能,利用python多做数据分析项目;对于入职后的朋友继续学习提升可视化能力和数据挖掘能力。