本文转载自:
http://blog.csdn.net/yangdashi888/article/details/52397990
https://www.zhihu.com/question/20852004
1、方差,标准差定义
很显然,均值描述的是样本集合的中间点,它告诉我们的信息是很有限的,而标准差给我们描述的则是样本集合的各个样本点到均值的距离之平均。以这两个集合为例,[0,8,12,20]和[8,9,11,12],两个集合的均值都是10,但显然两个集合差别是很大的,计算两者的标准差,前者是8.3,后者是1.8,显然后者较为集中,故其标准差小一些,标准差描述的就是这种“散布度”。之所以除以n-1而不是除以n,是因为这样能使我们以较小的样本集更好的逼近总体的标准差,即统计上所谓的“无偏估计”。而方差则仅仅是标准差的平方。
那么,为什么还需要协方差呢?标准差和方差一般是用来描述一维数据的,但现实生活我们常常遇到含有多维数据的数据集,最简单的大家上学时免不了要统计多个学科的考试成绩。面对这样的数据集,我们当然可以按照每一维独立的计算其方差,但是通常我们还想了解更多,比如一个学科与另一个学科的相关性,如高数成绩与数理统计成绩是否相关等。这时候就需要协方差。
2、通俗的理解协方差
3、验证文献中的协方差公式
文献为:Zhang, Y,2017 Global variation of transpiration and soil evaporation and the role of their major climate drivers. J. Geophys. Res. :Atmospheres. (http://onlinelibrary.wiley.com/doi/10.1002/2017JD027025/full)
文章中分析了实际蒸散发ETa,植被蒸腾T和土壤蒸发E的关系,公式11