
两变量的Pearson相关系数有自己的使用条件,要求两个连续变量 服从双变量正态分布,也叫做二元正态分布。双变量正态分布?是指两个变量均要服从正态分布吗?类似的问题比如:请问使用皮尔逊相关系数描述两变量关系时,要求满足X、Y呈双变量正态分布。这里的双变量正态分布是什么意思?是说X和Y都分别满足正态分布么?

【统计咨询】微信公众号撰文列举多部医学统计学教材提到: 有一点可以确认的是二元正态分布并不等于两变量均服从正态分布。此外列举的英文文献中提到: 两变量均服从正态分布不一定会服从双变量正态分布。有意思的是,这篇文章还利用R语言进行抽样测试,分析发现:重复1万次实验,发现服从两变量正态分布的实验中:以P=0.1为界值时,有约11%比例是不服从双变量正态分布的;以P=0.05为界值时,有约6%比例是不服从双变量正态分布的。两者距离我们预设的界值仅有1%之差。说明什么呢?如果我们为了简便,而把双变量正态分布直接理解“是两个变量均服从正态分布”, 这是会犯错误的,当然这个错误并不是特别离谱