关联分析
基本作用:
推断商品之间的商品关联关系
实现方法:
Apriori 关联分析和关联规则
Eclat 关联分析
FP-tree 关联
漏斗分析法
基本作用:
转化漏斗模型,是分析用户使用某项业务时,经过一系列步骤转化效果的方法
实现方法:
帕累托分析法
基本作用:
二八原则
RFM 分析
基本作用:
最近一次消费时间(R):客户距离最近的一次采购时间的间隔。
最近一段时间内消费频次(F):指客户在限定的期间内所购买的次数。
最近一段时间内消费金额(M):客户的消费能力,通常以客户单次的平均消费金额作为衡量指标。
RFM 分析就是通过三个关键指标对客户进行观察和分类,判断每类细分用户的价值。针对不同的特征的客户进行相应的营销策略。
留存分析法
基本作用:
留存分析法是一种用来分析用户参与情况和活跃程度的分析模型,考察进行初始行为的用户中,有多少人会进行后续行为。
从用户的角度来说,留存率越高就说明这个产品对用户的核心需求也把握的越好,转化成产品的活跃用户也会更多,最终能帮助公司更好的盈利
分组分析法
基本作用:
分组分析法是根据数据分析对象的特征,按照一定的标志(指标),把数据分析对象划分为不同的部分和类型来进行研究,以揭示其内在的联系和规律性。
分组的目的就是为了便于对比,把总体中具有不同性质的对象区分开,把性质相同的对象合并在一起,保持各组内对象属性的一致性、组与组之间属性的差异性,以便进一步运用各种数据分析方法来揭示内在的数量关系,因此分组法必须与对比法结合运用。
基本目的:
分组分析在日常工作中应用的比较多的是用户分层与分群,比如在发优惠券的时候,可以通过红包,满减,限时券还有积分券等方式。我们可以针对不同的用户发送不同的优惠券以达到精细化运营的效果。那么当我们在做数据分析时,也可以从结果将用户进行分层来进行判断,这时同样也可以得到优化和改进业务的建议
矩阵分析法
基本作用:
矩阵分析法是指根据事物(如产品、服务等)的两个重要属性(指标)作为分析的依据,进行分类关联分析,找出解决问题的一种分析方法,也称为矩阵关联分析法,简称矩阵分析法。
矩阵关联分析法在解决问题和资源分配时,可以为决策者提供重要参考依据——先解决主要矛盾,再解决次要矛盾,这样有利于提高工作效率,并将资源分配到最能产生绩效的部门、工作中,最终有利于决策者进行资源优化配置。
指标分析法
基本作用:
在实际工作中,当拿到一些可视化数据图表或者是Excel表格时,我们可以直接运用统计学中的一些基础指标来做数据分析,比如平均数、众数、中位数、最大值、最小值等
对比分析法
基本作用:
对比分析法是指将两个或两个以上的数据进行比较,分析它们的差异,从而揭示这些数据所代表的事物发展变化情况和规律性。
它可以非常直观地看出事物某方面的变化或差距,并且可以准确、量化地表示出这种变化或差距是多少?对比分析法可分为静态比较和动态比较两类。
聚类分析
基本作用:
聚类是将数据分类到不同的类或者簇这样的一个过程,所以同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。
基本实现:
从统计学的观点看,聚类分析是通过数据建模简化数据的一种方法。
传统的统计聚类分析方法包括系统聚类法、分解法、加入法、动态聚类法、有序样品聚类、有重叠聚类和模糊聚类等。
采用k-均值、k-中心点等算法的聚类分析工具已被加入到许多著名的统计分析软件包中,如SPSS、SAS等。
从机器学习的角度讲,簇相当于隐藏模式。
聚类是搜索簇的无监督学习过程。
与分类不同,无监督学习不依赖预先定义的类或带类标记的训练实例,需要由聚类学习算法自动确定标记,而分类学习的实例或数据对象有类别标记。
聚类是观察式学习,而不是示例式的学习。
其他知识点:
1、性质分类:
Q型聚类分析:对样本进行分类处理,又称样本聚类分祈使用距离系数作为统计量衡量相似度,如欧式距离、极端距离、绝对距离等
R型聚类分析:对指标进行分类处理,又称指标聚类分析使用相似系数作为统计量衡量相似度,相关系数、列联系数等
2、方法分类:
1)系统聚类法:适用于小样本的样本聚类或指标聚类,一般用系统聚类法来聚类指标,又称分层聚类
2)逐步聚类法:适用于大样本的样本聚类
3)其他聚类法:两步聚类、K均值聚类等
判别分析
基本功能:
1、判别分析:根据已掌握的一批分类明确的样品建立判别函数,使产生错判的事例最少,进而对给定的一个新样品,判断它来自哪个总体
主成分分析
基本功能:
主成分分析(Principal Component Analysis,PCA), 是一种统计方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。
因子分析
基本功能:
一种旨在寻找隐藏在多变量数据中、无法直接观察到却影响或支配可测变量的潜在因子、并估计潜在因子对可测变量的影响程度以及潜在因子之间的相关性的一种多元统计分析方法
时间序列分析
基本功能:
动态数据处理的统计方法,研究随机数据序列所遵从的统计规律,以用于解决实际问题;时间序列通常由4种要素组成:趋势、季节变动、循环波动和不规则波动。
主要方法:
移动平均滤波与指数平滑法、ARIMA横型、量ARIMA横型、ARIMAX模型、向呈自回归横型、ARCH族模型
生存分析
基本功能:
用来研究生存时间的分布规律以及生存时间和相关因索之间关系的一种统计分析方法
典型相关分析
相关分析一般分析两个变量之间的关系,而典型相关分析是分析两组变量(如3个学术能力指标与5个在校成绩表现指标)之间相关性的一种统计分析方法。
R0C分析
R0C曲线是根据一系列不同的二分类方式(分界值或决定阈).以真阳性率(灵敏度)为纵坐标,假阳性率(1-特异度)为横坐标绘制的曲线
信度分析
信度(Reliability)即可靠性,它是指采用同样的方法对同一对象重复测量时所得结果的一致性程度。
信度指标多以相关系数表示,大致可分为三类:稳定系数(跨时间的一致性),等值系数(跨形式的一致性)和内在一致性系数(跨项目的一致性)。
信度分析的方法主要有以下四种:重测信度法、复本信度法、折半信度法、α信度系数法。
假设检验
1、参数检验
参数检验是在已知总体分布的条件下(一股要求总体服从正态分布)对一些主要的参数(如均值、百分数、方差、相关系数等)进行的检验。
2、非参数检验
非参数检验则不考虑总体分布是否已知,常常也不是针对总体参数,而是针对总体的某些一股性假设(如总体分布的位罝是否相同,总体分布是否正态)进行检验。
主要方法包括:卡方检验、秩和检验、二项检验、游程检验、K-量检验等。
描述统计
描述统计是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。
描述统计分为集中趋势分析和离中趋势分析和相关分析三大部分。
细分分析法
细分分析法是最常用的数据分析方法,对一个指标按不同的维度进行细分查看,往往就能找到影响数据指标涨幅的原因。细分方法可以分为两类:
一类是逐步分析,比如:来北京市的访客可分为朝阳,海淀等区;
另一类是维度交叉,如:来自付费SEM的新访客。
画像分析法
在数据分析中,经常会用到用户画像分析,比如在漏斗转化过程中,有200个用户在某个流程中流失了,那我们需要对这200个用户进行画像查看,查看具备什么样特征的用户特别容易流失。
再比如我们去广告投放之前,我们需要知道产品核心用户的用户画像,这样在选择广告渠道上面就会非常得心应手,在换量的渠道上,也可以评估他们的用户群体和我们产品的用户画像是否一致,有多大比例上重叠的。
AB测试
增长黑客的主要思想之一,是不要做一个大而全的东西,而是不断做出能够快速验证的小而精的东西,快速验证,那如何验证呢?
主要方法就是AB测试。
当我们从数据中找到问题的时候,我们需要验证洞见是否正确,这时候就需要AB测试的帮忙,将一批用户引导到新的运营方案上,之后来验证洞见是否正确。
只有从用户中得到验证的假设才是有价值的。
其他分析方法
基本方法:
多重响应分析、距离分祈、项目分祈、对应分祈、决策树分析、神经网络、系统方程、蒙特卡洛模拟等