数据分析的方法论大致分为:描述性数据分析、数理统计分析、数据挖掘分析。
本篇文章将就此展开谈谈这三种数据分析方法论(方法论没有好坏高低之分,只有合适的。根据业务场景来选择合适的分析方法。一定要以目标为导向,并不是手法越高级就越好。能用简单分析的就不需要使用大数据挖掘。)
一、描述性数据分析方法
描述性数据分析可以用一言蔽之”一句话描述数据“。我们平时说的,这个月的平均访问量是多少,环比增长了多少。用户平均付费是多少,中位数是多少,众位数是多少,四分位数是多少都属于描述性统计分析。描述数据的集中趋势还可以用方差、标准差。用一个指标,一句话概括数据特点。描述数据之间的简单关系可以用相关性分析,如转化率和用户停留时间的正相关的(距离,以实际为准。一般也是这样。)这边大家都比较熟悉,不过多介绍。
二、数理统计分析方法
数理统计涉及较多的数学知识,但是其实常用的也就是概率论和微积分,本科的知识稍微复习一下还是容易掌握的。微积分只需要用到一元积分,用于计算概率分布。统计学中有许许多多的内容,在数据分析中,并不是所有都需要掌握。因为我们不是在做实验室里科学实验的数据分析。
1. 方差分析
方差分析,又称为F检