从零开始学数据分析,什么程度可以找到工作?( 内附20G、5000分钟数据分析工具教程大合集 )...

从零开始学数据分析,什么程度可以找到工作?( 内附20G、5000分钟数据分析工具教程大合集 )

 

我现在在Coursera上面学data science 中的R programming,过去很少接触过统计、计算机这两个学科,现在很想转行做数据。问题如下: 

1.Data需要学到什么程度可以找工作?
2.初级的数据分析会做哪些工作?
3.数据分析有什么小方向吗?
4.想要深度做数据分析有怎样的建议?

5.统计的学习应该从哪里下手?

 

本文将给你以上问题所有答案,文末还有UniCareer为大家独家整理的20G共计5000分钟SAS+SPSS+Python+R高清视频教程等你来免费领取!

 

首先根据行业经验,做数据分析一般有这几个阶段:

 

 

第一阶段一般岗位叫数据专员

 

基本学会Excel(VBA最好学会;会做透视表;熟练用筛选、排序、公式),做好PPT。这样很多传统公司的数据专员已经可以做了

 

第二阶段数据专员~数据分析师

 

这一阶段要会SQL,懂业务,加上第一阶段的那些东西。大多数传统公司和互联网小运营、产品团队够用了。

 

第三阶段数据分析师

 

统计学熟练(回归、假设检验、时间序列、简单蒙特卡罗),可视化,PPT和Excel一定要溜。这些技术就够了,能应付大多数传统公司业务和互联网业务。

 

第四阶段开始细分

 

  • 数据分析师(数据科学家)、BI等:这部分一般是精进统计学,熟悉业务,机器学习会使用(调参+选模型+优化),取数、ETL、可视化啥的都是基本姿态。

     

  • 可视化工程师:这部分国内比较少,其实偏重前端,会high charts,d3.js, echarts.js。技术发展路线可以独立,不在这四阶段,可能前端转行更好。

     

  • ETL工程师:顾名思义,做ETL的。

     

  • 大数据工程师:熟悉大数据技术,hadoop系二代。

     

  • 数据工程师(一部分和数据挖掘工程师重合):机器学习精通级别(往往是几种,不用担心不是全部,和数据分析师侧重点不同,更需要了解组合模型,理论基础),会组合模型形成数据产品;计算机基本知识(包括linux知识、软件工程等);各类数据库(RDBMS、NoSQL(4大类))

     

  • 数据挖掘师:和上基本相同。

     

  • 爬虫工程师:顾名思义,最好http协议、tcp/ip协议熟悉。技术发展路线可以独立,不在这四阶段

 

接下去说一说往数据发展的基本学习路径可以概括为以下内容:

 

 

1.Excel、PPT必须精通

数据工作者的基本姿态,话说本人技术并不是很好,但是起码会操作;要会大胆秀自己,和业务部门交流需求,展示分析结果。技术上回VBA和数据透视就到顶了。

 

2.数据库类必须学

初级只要会RDBMS就行了,看公司用哪个,用哪个学哪个。没进公司就学MySQL吧。

NoSQL可以在之后和统计学啥的一起学。基本的NoSQL、MongoDB和Redis(缓存,严格意义上不算数据库)。

 

然后(选学)可以了解各类NoSQL,基于图的数据库Neo4j,基于Column的数据库BigTable,基于key-value的数据库redis/cassendra,基于collection的数据库MongoDB。

 

3.统计学必须学

 

如果要学统计学,重要概念是会描述性统计、假设检验、贝叶斯、极大似然法、回归(特别是广义线性回归)、主成分分析。这些个用的比较多。也有学时间序列、bootstrap、非参之类的,这个看自己的意愿。


其他数学知识:线性代数常用(是很多后面的基础),微积分不常用,动力系统、傅里叶分析看自己想进的行业了。

 

4.机器学习数据分析师要求会选、用、调

 

常用的是几个线性分类器、聚类、回归、随机森林、贝叶斯;不常用的也稍微了解一下;深度学习视情况学习。

 

5.大数据选学,有公司要求的话会用即可,不要求会搭环境

 

hadoop基础,包括hdfs、map-reduce、hive之类;后面接触spark和storm再说了。

 

6.文本类选学,有公司要求的话会用即可

 

基本要知道次感化、分词、情感分析啥的。

 

7.工具类以下根据个人职业发展选学

 

语言:非大数据类R、Python最多(比较geek的也有用julia的,不差钱和某些公司要求的用SAS、Matlab);大数据可能还会用到scala和java。


可视化(选学):tableau、http://plot.ly、d3.js、echarts.js,R里面的ggplot、ggvis,Python里的bokeh、matplotlib、seaborn都不错


数据库语言:看你自己用啥学啥


其他框架、类库(选学):爬虫(requests、beautifulsoup、scrapy),日志分析(常见elk)

 

文字不够直观?下面两幅长图保存好:

 

 

你在习Python数据分析的时候,是否遇到过在这些问题? 别慌!这些都是数据科入门常见问题。从入门到上手再到解决实际问题,数据科看似复杂,但如果你掌握了正确的习方法,完全可以极速入门。 【职场人进阶必备  数据分析/挖掘一点通】 如今的职场上,90%以上的岗位都会涉及数据问题。 以产品文案岗位为例,在一个新产品推向市场之前,文案需要考虑: 此时,可以关注一下市场上已有的相关产品推广数据,如:哪些文案打开率更高?哪些文案转化更好?目标用户的购买习惯如何? 以此作为下一步工作开展的依据,对产品文案工作者来说,可以少走很多弯路。 数据分析/挖掘,等于站巨人的肩膀上工作,轻松且高效。 【爬虫数据分析、数据挖掘知识点三合一】数据问题一网打尽 本课程将知识点悉数融入实战项目,不空谈语法,帮助员在实践中获取知识,目标是:让员能自主完成数据采集、数据分析与数据挖掘。 习完本课程,你可以熟练掌握: 【实战案例超实用,轻松拥有“睡后收入”!】 本课程以股票案例为主线,串联爬虫数据分析以及数据挖掘多个知识点。 通过实战案例演练,你可以全面掌握股票收益的分析和预判方法,在收获新技能的同时,也有机会获得“睡后收入”! 四大优势: 三重权益:
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值