产品健康度模型之指标关联性分析
我们这里做关联性分析的目的就是找出运维指标和运营指标的相关程度。这里重新贴一下指标的结构图:
指标离散化
这里需要说明的是,这些指标可能是连续的,也有可能是离散的,比如我们有运维指标 a,b,c ,以及运营指标 d,e ,这些指标都有可能是离散的或者连续的,并且我们的目标是将运维和运营指标两两计算关联性。这里我们就需要计算 {
a,d},{
a,e},{
b,d},{
b,e},{
c,d},{
c,e} 之间得关联性。
当然,我们完全可以分情况讨论,对于离散VS离散、离散VS连续、连续VS连续指标分别采用不同的关联性分析的方法,但是分别采用不同的方法,那么关联性数值之间的又不具备可比性,在后面我们发现,我们需要这些关联性都是同质的特征。
对于离散VS离散、离散VS连续、连续VS连续指标这三种情况,我们的处理就是将连续的指标离散化,这样就将问题转换成了衡量两个离散指标的概率依赖的问题。
但是指标怎样进行离散化呢,对于连续指标 a ,