数据分析

https://zhuanlan.zhihu.com/p/61628903

一、为什么学习数据分析

1、运营的尴尬:运营人需要一个硬技能

每个初入行的新人都会察觉到,运营是一个似乎并没有自己的核心竞争力和安全感的工作。因为每天的工作好像都被各种琐事所围绕,而只有一个主题是永恒不变的,那就是---提需求,不断的提各种需求。

运营人需要一个硬核技能,提升自己的职业价值,提高自己的职业安全感,而不是每天都在各种的等排期:数据分析排期、产品设计排期、UI排期、开发排期。

运营迫切需要通过利用SQL/Python等工具,从数据中及时发现更多的业务价值,提高自己的产出。

2、数据分析的前景

这几年随着人工智能的火热,数据分析技能也逐渐受到了更多的认可。从国外BA专业申请和国内数据分析培训的火热也可见一斑。但对于在职人士,从单纯的技能习得角度去看,BA的能力完全是可以自学获得的。

我认为,未来数据分析能力在运营人的能力模型中的比重仍会继续加大,将来甚至会挤压数据分析师的需求和生存空间,所以,对于数据分析,前景很好,而数据分析师,前景并不乐观。

二、学习数据分析需要做的准备

1、明确方向:

数据分析有两个方向:

一个是业务向:如数据产品经理、数据分析师,对技术要求并不那么高;

一个是技术向:需要懂数据挖掘、算法等,对技术的要求较高。

从自己的定位来看,并不打算做数据挖掘,因为自己的知识结构和时间上的投入产出比可能并不太高。主要希望通过数据分析技能,增强自己作为产品运营的竞争力。

2、做好持久战准备:

于我一个没有任何基础的纯小白而言,并不是能速成的,需要做好持续学习的准备。

三、做好数据分析需要具备哪些技能

1、统计学基础知识

2、Excel的熟练使用

3、SQL

4、Python

5、分析方法和思维

6、对业务的充分理解

从自身来看,主要需要弥补的为:SQL+EXCEL+统计+PYTHON

主要以看书为主,视频为辅,不需要报任何的培训班。

1、SQL

SQL大概是互联网公司做数据分析用到的最多、最重要的工具了,在整个数据分析过程中,用Sql提取数据,可能要占到整个数据分析过程的50%-80%,以至于很多数据分析师都被戏称为“Sql Boy/Girl”。

mysql数据库的功能可以用四个字概括:增删改查。

但是对于我们来说,我们能用到的只会有数据库查询功能,其它权限是不可能开放给你的。

如果数据库你觉得生涩的话,可以这么理解:

•SQL? 就是一条存取数据的命令

•数据库? 就相当于一个文件夹

•数据表? 就相当于文件夹内的一个Excel文件

–表名就是文件名

–表中的每一列有一个名字,就是列名,也可以成为字段

SQL的学习可以分为三块:

简单查询、

关联查询、

函数引用。

什么是查询呢?

在数据库建立之后,通过sql命令里最常用的语句SELECT,让我们查看数据库里保存的数据,并可以进行一定的分析和归纳。

简单查询:

SELECT语句的完整格式包含6个子句:

1、FROM 子句:查询数据的表,指定数据的来源。

2、WHERE 子句:查询数据的过滤条件。

3、GROUP BY 子句:对匹配 WHERE 子句的查询结果进行分组。

4、HAVING 子句:对分组后的结果进行条件限制。

5、ORDER BY 子句:对查询结果进行排序,后面跟 DESC 降序或 ASC 升序(默认)。

6、LIMIT 子句:对查询的显示结果限制行数。

关联查询:

如果要进行多表查询,就需要用到连接。

连接查询是把两个或多个表连接在一起来获取数据,是关系型数据库中最主要的查询。表的连接方式主要包括内连接、外连接和交叉连接等。

1、from 指定查询表名、并给出别名。

2、left join 左外连接,左表全部记录及右表匹配记录出现在查询结果中。

3、inner join 内连接,左表和右表共同的记录出现在查询结果中。

4、right join 右外连接,右表全部记录及左表匹配记录出现在查询结果中。

5、on 指定关联条件。

表连接后的结果可以通过这个图清晰的展示出来。

 

举个栗子:

函数引用:

利用函数可以提高sql的效率,经常用到的函数主要有:

逻辑运算:and、or、not;

数值运算:round、floor、ceil、rand、exp、sqrt等;

日期函数:from_unixtime、unix_timestamp、year、month、day、hour、minute、second、weekofyear、detediff、date_add、date_sub等;

条件函数:if、coalesce、case when等;

字符串函数:concat、substr、trim、reverse、split等;

集合统计函数:count、sum、max、min、percentile等。

推荐书目:

推荐下我们部门每个运营同学人手一本的必备书目:

《SQL必知必会》

经典习题:

https://blog.csdn.net/flycat296/article/details/63681089

Hive

随着数据量的不断增加,很多时候mysql已经满足不了数据需要,很多公司开始使用hive或者presto。

其实有了SQL的基础,HIVE学习还是比较简单的。

推荐书目:《HIVE编程指南》

重点看下HQL的数据操作、查询、调优部分,与mySQL大同小异,只是一些语法需要单独注意下即可。

2、Excel

Excel大家多少都会一些,它的功能很强大,但是绝大多数人,可能使用了它的1%功能都不到。

Excel 可以进行各种数据的处理、统计分析和辅助决策等,作为常用的数据处理和展现工 具,我们除了要熟练使用Excel 的函数和数据透视表等操作工具,更重要的是,利用好Excel 的可视化,用图表将结论展现出来,这样分析和可视化能力会得到迅速提高。

SQL+Excel可以说是数据分析的必备神器。

推荐书目:《谁说菜鸟不会数据分析》。

这本书不只是介绍Excel的功能,更重要的是介绍一些实践场景中数据分析的步骤和思路,对于初学者有很大的指导意义。

另外通过以下视频可以更加直观的学习各类函数、透视表和可视化的使用。内容很全,需要的话,可以在我的公号【从南迹】回复“EXCEL”获取。

3、统计学

统计学是数据分析的理论基础,可以使数据分析更加系统化。没有统计学基础的数据分析师的职业发展之路不会长远,因为在工作中可能会常常遇到不知道该用什么方法找寻数据规律的瓶颈,因此掌握数据分析的统计学基础知识是成为一名优秀数据分析师的基础。

主要需要掌握:

用于集中趋势分析的平均数、中数、众数;

用于离中趋势分析的全距、 四分差、平均差、方差、标准差;

研究现象之间是否存在某种依存关系的相关分析;

确定两种或 两种以上变数间相互依赖的定量关系的回归分析;

揭示同一个变量的各个类别之间的差异,以及不同变量各个类别之间的对应关系的关联分析、R-Q 型因子分析;

研究从变量群中提取共性因子 的因子分析;

用于两个及以上样本均数差别的显著性检验的方差分析;

概率及分布、参数估计、 假设检验等等经典统计学内容。

很多人都推荐《商务与经济统计》,说实话,这本书对小白并不友好。

我的进阶路径是:《赤裸裸的统计学》→《深入浅出统计学》→《商务与经济统计》

前面2本书更加有趣味性,对于小白,更容易理解,不至于让你很快从学习到放弃。

4、Python

说实话,互联网行业日常的数据分析中用到python的机会并不多,SQL+EXCEL可以说能解决95%的工作需要。另外5%主要是在数据量较大,SQL已经无法满足工作需要时,那么Python大法就该出场了。

我们分析一般都是有了现成的公司数据,很少有从外部获取的,所以爬虫,可以暂时先不学,有需要的话,先找爬虫插件搞定即可。

主要学习python基础和数据分析的几个包。

作为一个没有编程、数学、统计基础的小白,我是从《父与子的编程之旅》开始看的,这本书对我这种完全负基础的人,真是极度友好,可以说,看了很多推荐的书和视频,最开始学习的时候,只有这一本书是我可以看懂,而且看得下去的。

这本书看完后,又对照《笨方法学python》做了些题目,然后可以进入python数据分析的学习,主要是《利用python进行数据分析》,主要掌握numpy、pandas、Matplotlib库等。

附上我很早之前的一个练习:

从南:10分钟实战python简单数据分析​zhuanlan.zhihu.com图标

整个数据分析的学习计划,我曾经写在这里

从南:这个时代,没有一个人是安全的​zhuanlan.zhihu.com图标

四、总结

最后总结下来,整个时间段,基本可以分为:

SQL:学习1个月,专门练习1个月,另加工作中持续练习

Excel:学习2周,专门练习1周

统计学:学习2个月

Python:学习6个月,一直在练习

数据分析是产品经理和产品运营都必须具备的能力之一,随着科技的发展,不懂技术的运营和产品终将要被淘汰。

现在稀缺的技能,在未来,一定会成为必备的一项基础素质。

我们应该面向未来去学习。

一起加油~~

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值