日常网优优化工作中,很难准确的将KQI及KPI指标关联起来定位问题,经常KQI指标差,而KPI指标没有明显劣化,因此很难从无线侧定位问题。
这时候可利用统计学中的皮尔逊相关系数 (Pearson correlation coefficient),度量KQI与KPI的线性相关性分析网络影响因素指标。
皮尔森相关系数是用来反应俩变量之间相似程度的统计量,在机器学习中可以用来计算特征与类别间的相似度,即可判断所提取到的特征和类别是正相关、负相关还是没有相关程度。
Pearson系数的取值范围为[-1,1],当值为负时,为负相关,当值为正时,为正相关,绝对值越大,则正/负相关的程度越大。若数据无重复值,且两个变量完全单调相关时,spearman相关系数为+1或-1。当两个变量独立时相关系统为0,但反之不成立。
Pearson相关系数的计算方法有三种形式,如下列公式所示: