好久没看统计书了,又要还给老师了。
来更新一点内容,主要是想复习复习。
协方差:协方差定义为
也可记为两个变量距平向量的内积,即为
。
协方差反映两个气象要素异常关系的平均状况。例如,如果代表前冬某一个月的平均温度;
代表后冬某一个月的平均温度,当前冬温度出现负距平时,后冬就出现正距平;反之,前冬出现正距平时,后冬就出现负距平;这时他们各年距平的乘积必然是一个很大的负数。这个负号表示了“前冬冷,后冬暖”的关系状况,表征一个相反变化的关系。如果相反,对于“前冬暖,后冬亦暖”的情况,两个序列距平乘积为正值。因而,协方差表征了两个变量变化的正、负相互关系。
变量自身对自身的协方差就是该变量的方差。
相关系数:相关系数是协方差的标准化处理。
协方差是带单位的一个统计量,在比较不同要素时常常带来不便。若对原变量做标准化处理,再计算协方差,此时的协方差不带单位,便于比较,称为相关系数。
对于两个要素变量和
, 其相关系数计算公式为
如用标准化向量表示,有
相关系数绝对值变化在0到1之间,即0≤|r|≤1。
参考文献:黄嘉佑,气象统计分析与预报方法(第四版)P21
决定系数(解释方差):相关系数的平方
离差平方和: ,反映因变量的离散程度
回归平方和:
残差平方和:
离差平方和=回归平方和+残差平方和:
该式说明因变量的离散程度一方面时由于随机因素的干扰造成的(SSE) ,另一方面时由于对离散的自变量的依赖程度造成的(SSR) 。
表示了回归平方和在离差平方和中所占比例,越接近1说明因变量对自变量的依赖关系越显著,拟合效果越好,因此也称决定系数为拟合优度。特别的,对于一元线性回归:y=a0+a1x1 ,决定系数就是变量(x,y) 的相关系数(因为只有一个要素变量x1 ,由上面相关系数的计算公式容易看出)。
参考文献:黄海洋,数学建模实验 P47