标准正态分布下mean=0,sd=1
95%置信区间为[mean-1.96*sd,mean+1.96*sd]
即左侧概率和为97.5%的数据减去左侧概率和为2.5%的数据,期间的数据概率即为95%的置信区间。那为什么是1.96倍呢,先看两个函数
dnorm
dnorm中的d表示density,norm表示正态分布,这个函数是正态分布的概率密度(probability density)函数。
给定x,μ和σ后,dnorm()这个函数返回的就是会返回上面的这个公式的值,如果是标准正态分布,dnorm(n,mean=0,sd=1)输出就是当取n时的概率值,就是正态分布图当x=n时y的值。
> dnorm(0,mean=0,sd=1)
[1] 0.3989423
> pnorm(0,mean=0,sd=1)
[1] 0.5
pnorm
pnorm函数中的p表示Probability,它的功能是,在正态分布的PDF曲线上,返回从负无穷到q的积分,其中这个q指的是一个Z-score,x=(mean+Z-score*sd)时的Z-score。现在我们大概就可以猜测出pnorm(0)的值是0.5,因为在标准正态分布曲线上,当Z-score等于0时,这个点正好在标准正态分布曲线的正中间,那么从负无穷到0之间的曲线面积就是整个标准正态分布曲线下面积的一半,pnorm(n,mean=0,sd=1)输出从负无穷到mean+sd*n的概率总和
> pnorm(1.96,mean=0,sd