几个概念
总体:所要考察对象的全部个体。
样本:从总体中所抽取的一部分个体。
总体皮尔逊person相关系数
直观理解协方差: 如果X、 Y变化方向相同,即当X大于(小于)其均值时, Y也大于(小于)其均值,在这两种情况下,乘积为正。如果X、 Y的变化方向一直保持相同,则协方差为正;同理,如果X、 Y变化方向一直相反,则协方差为负;如果X、 Y变化方向之间相互无规律,即分子中有的项为正,有的项为负,那么累加后正负抵消。
注:协方差的大小和两个变量的量纲有关,因此不适合比较。
皮尔逊相关系数也可以看成是剔除了两个变量量纲影响,即将x和y标准化后的协方差。
样本皮尔逊person相关系数
相关性可视化
注:这里的相关系数只是用来衡量两个变量线性相关的指标;也就是说,你必须先确认这两个变量是线性相关的,然后这个相关系数才能告诉你他俩相关程度如何。
容易犯错和忽略的点
题目
描述性统计
代码:
MIN = min(Test); % 每一列的最小值
MAX = max(Test); % 每一列的最大值
MEAN = mean(Test); % 每一列的均值
MEDIAN = median(Test); %每一列的中位数
SKEWNESS = skewness(Test); %每一列的偏度
KURTOSIS = kurtosis(Test); %每一列的峰度
STD = std(Test); % 每一列的标准差
RESULT = [MIN;MAX;MEAN;MEDIAN;SKEWNESS;KURTOSIS;STD] %将这些统计量放到一个矩阵中表示
皮尔逊相关系数的计算
计算皮尔逊相关系数前一定要记得画散点图。