python用户画像统计词云_数据分析岗位要求词云分析

博主转行数据分析,工作中大量使用Python和Excel,通过爬取500条招聘数据,分析岗位要求,发现数学基础、工具技能和数据分析思维是重点。词云图显示“统计”“数学”“SQL”“Python”等高频词,强调数学内功、工具掌握及业务理解的重要性。
摘要由CSDN通过智能技术生成

距离上一次总结已经一个多月了。转行到数据分析工程师岗位这段时间,还是比较忙的。现在的公司在我来之前,没有人做数据分析的工作。领导关于数据的所有需求,都是我来从0开始想办法完成,包括运营数据的分析,可视化,爬虫这种常见的,还有文本分词、知识图谱、自然语义方面这种之前从来没接触过的。所以,现在都是一边学习,一边想法子运用到工作里去。

现在的工作中,我用到Python和Excel是最多的。最近的学习计划里,数学基础的学习上花的时间最多。但是,一直感觉自己目前用的关于数据分析的技能还是很单薄。

大家可能也有这样的感觉,当我们想转行到数据分析岗位的时候,到网络上接触到各种文章、课程、社群,他们推荐了各种书,讲了各种不太理解的专业词:数据挖掘、算法、模型、BI、RFM、用户画像等等。太多的名词,越听越懵。

所以,这次我就专门爬取了500条招聘网站的数据分析岗位需求数据。我们的目的是要找工作嘛,那就来分析一下用人单位有什么需求。

这次不分析前面的数据了,想看的同学可以移步到拉勾网数据分析师职位需求分析。

数据清洗的过程很简单,将岗位要求列进行分词,清理掉没有含义的词,再统计一下词频,最后画出词云图。

这个过程都是通过python完成,用到了jieba包和pyecharts包。

根据这个词云图,我将岗位要求分为一下3点:

1 数学基础

红框标注的词里,“统计”“数学”相关的词出现的频率很高,要想成为优秀的数据分析师,数学是内功。数学基础包括统计学、概率论、线性代数、微积分这些课程,数据挖掘和算法建模都是基于这些基础知识的。很多公司都是要求“本科”“以上学历”,也有这部分原因。当然,这些我们也可以自己通过努力,重新学习。

2 工具技能

按照词出现频率从高到低:

“报告”:出现最多就说明最重要,我们展示自己分析结果的技能一定要硬;

“SQL”:工具类里出现最多,学习也不难;

“计算机”:计算机技术的难度主要体现在编程语言上,这是数据分析的外功;

“Python”:我目前用的最多的编程语言,做数据分析、可视化、算法建模都很方便,由于各种包的存在,能做很多事情,比如遍历一个文件夹里的文件,删掉不想要的文件;

“R”:类似于Python;

“Excel”:基础工具,数据量不大的时候,效率很高;

“PPT”:做报告的工具,加分项;

“SPSS”、“hadoop”、“hive”、“Java”、“BI”、“tableau”:这些出现的频率不高,但是也有需求,有时间可以考虑学习了解一下。

3 数据分析思维

数据分析思维都是要结合公司的业务,这方面要多看书,看别人做的项目。我就不推荐书了,自己可以去搜索。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值