应用场景:在实际应用中,我们常常会想了解两个变量之间的关系 这里举一个简单的例子:一个商店的经理想确定,周末电视广告播放的次数与下周商店销售额之间的关系 我们使用:协方差和相关系数,作为衡量两个变量关系的方法
一 协方差的一些解释:
在坐标轴中,使用x_u、y_u画两条直线,会使数据分布在四个象限 当s_xy为正时,表示变量x、y是正的线性关系,即x增加,y增加 当s_xy为负时,表示变量x、y为负的线性关系,即x增加,y减小 当s_xy=0时,表示数据均匀的分布在四个象限中,两个变量基本没有相关性
二 皮尔逊基相关系数的一些解释:
如果变量x、y存在完全的线性关系时,所有的点在一条直线上,此时相关系数的值为 1(完全正线性关系) 或 -1(完全负线性关系) 当相关系数越接近0值,表示越若的线性关系,当相关系数为0时,表示两个变量没有相关性
三 一份简单的计算代码
import numpy as np
# 协方差的度量
def XFCWork(x, y): # 注:使用这种方法时,两个变量属性相近,度量单位相同,否则会因为度量单