距离上一次总结已经一个多月了。转行到数据分析工程师岗位这段时间,还是比较忙的。现在的公司在我来之前,没有人做数据分析的工作。领导关于数据的所有需求,都是我来从0开始想办法完成,包括运营数据的分析,可视化,爬虫这种常见的,还有文本分词、知识图谱、自然语义方面这种之前从来没接触过的。所以,现在都是一边学习,一边想法子运用到工作里去。
现在的工作中,我用到Python和Excel是最多的。最近的学习计划里,数学基础的学习上花的时间最多。但是,一直感觉自己目前用的关于数据分析的技能还是很单薄。
大家可能也有这样的感觉,当我们想转行到数据分析岗位的时候,到网络上接触到各种文章、课程、社群,他们推荐了各种书,讲了各种不太理解的专业词:数据挖掘、算法、模型、BI、RFM、用户画像等等。太多的名词,越听越懵。
所以,这次我就专门爬取了500条招聘网站的数据分析岗位需求数据。我们的目的是要找工作嘛,那就来分析一下用人单位有什么需求。
这次不分析前面的数据了,想看的同学可以移步到拉勾网数据分析师职位需求分析。
数据清洗的过程很简单,将岗位要求列进行分词,清理掉没有含义的词,再统计一下词频,最后画出词云图。
这个过程都是通过python完成,用到了jieba包和pyecharts包。
根据这个词云图,我将岗位要求分为一下3点:
1 数学基础
红框标注的词里,“统计”“数学”相关的词出现的频率很高,要想成为优秀的数据分析师,数学是内功。数学基础包括统计学、概率论、线性代数、微积分这些课程,数据挖掘和算法建模都是基于这些基础知识的。很多公司都是要求“本科”“以上学历”,也有这部分原因。当然,这些我们也可以自己通过努力,重新学习。
2 工具技能
按照词出现频率从高到低:
“报告”:出现最多就说明最重要,我们展示自己分析结果的技能一定要硬;
“SQL”:工具类里出现最多,学习也不难;
“计算机”:计算机技术的难度主要体现在编程语言上,这是数据分析的外功;
“Python”:我目前用的最多的编程语言,做数据分析、可视化、算法建模都很方便,由于各种包的存在,能做很多事情,比如遍历一个文件夹里的文件,删掉不想要的文件;
“R”:类似于Python;
“Excel”:基础工具,数据量不大的时候,效率很高;
“PPT”:做报告的工具,加分项;
“SPSS”、“hadoop”、“hive”、“Java”、“BI”、“tableau”:这些出现的频率不高,但是也有需求,有时间可以考虑学习了解一下。
3 数据分析思维
数据分析思维都是要结合公司的业务,这方面要多看书,看别人做的项目。我就不推荐书了,自己可以去搜索。