随机变量的概率分布
- 随机变量概括性度量
- 平均数
mymean<-sum(table$不合格品数*table$概率)
- 方差
myvar<-sum((table$不合格品数-mymean)^2*table$概率)
- 标准差
sqrt(myvaar)
- 随机变量经典分布
- 二项分布
#密度函数
dbinom(被选取个数,总选取个数,概率)
#分布函数(累积)
pbinom(3,5,0.06)
- 正态分布
#计算正态分布概率
pnorm(40,mean = 50,sd=10)#小于
pnorm(40,mean = 50,sd=10)-pnorm(30,mean = 50,sd=10)
#计算正态分布分位数
qnorm(0.025,mean=0,sd=1) #左侧概率值
- 卡方分布
#计算概率
pchisq(10,df=15)#小于
1- pchisq(15,df=25)#大于
#计算分位数
qchisq(0.95,df=10) #左值
- t分布
#计算概率
pt(-2,df=10)#小于
1- pt(3,df=15)#大于
#计算分位数
qt(0.975,df=25) #左值
- F 分布
#计算概率
pf(3,df1=10,df2=8)
1- pf(2.5,df1=18,df2=15)
#计算分位数
qf(0.95,df1=25,df2=20) #左值
文章目录
文章目录
4.1 随机变量的概括性度量
计算期望值和方差
> table<-read.csv("/Users/zhourui/Documents/exercise4_1.csv")
> table
不合格品数 概率
1 0 0.75
2 1 0.12
3 2 0.08
4 3 0.05
#平均数
> mymean<-sum(table$不合格品数*table$概率)
> mymean
[1] 0.43
#方差
> myvar<-sum((table$不合格品数-mymean)^2*table$概率)
> myvar
[1] 0.7051
#标准差
> sqrt(myvar)
[1] 0.8397023
4.2 随机变量的经典分布
4.2.1 离散型分布
1、二项分布
> k=seq(0.1,0.9,0.1) #[1] 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
> par(mfrow=c(3,3),mai=c(0.6,0.5,0.2,0.1)) #实现一页多图的功能
> for(i in 1:9)
+ + barplot(dbinom(0:5,5,k[i]),xlab = "x",ylab = "p",ylim = c(0,0.6),main = substitute(B(5,b),list(b=k[i])),col = "red")
#没有不合格的概率
> dbinom(0,5,0.06)
[1] 0.733904
#恰有一个不合格的概率
> dbinom(1,5,0.06)
[1] 0.2342247
#有三个及三个以下的不合格品概率
> pbinom(3,5,0.06)
[1] 0.9999383
4.2.2 连续型分布
1、正态分布
> par(mai=c(0.6,0.5,0.2,0.1),cex=0.7)
> curve(dnorm(x,-2,1),from=-6,to=2,xlim = c(-6,6),ylab = "Density")
> #绘制正态曲线
> abline(h=0)
> #绘制基准线
> curve(dnorm(x,-2,1.5),from=-7,to=3,add=T,xlim = c(-6,6),col = "red")
> curve(dnorm(x,2,1.5),from=-3,to=7,add=T,xlim = c(-6,6),col = "blue")
> segments(-2,0,-2,dnorm(2,mean=2,sd=1),lty=2,col = "red")
> #绘制中线
#计算正态分布概率
> pnorm(40,mean = 50,sd=10)
[1] 0.1586553
> pnorm(40,mean = 50,sd=10)-pnorm(30,mean = 50,sd=10)
[1] 0.1359051
> pnorm(2.5,mean = 0,sd=1)
[1] 0.9937903
> pnorm(2,mean = 0,sd=1)-pnorm(-1.5,mean = 0,sd=1)
[1] 0.9104427
#计算正态分布分位数
> qnorm(0.025,mean=0,sd=1) #左侧概率值
[1] -1.959964
1、X^2分布
#画图
> par(mfrow=c(2,3),mai=c(0.6,0.6,0.2,0.1))
> n=5000
> df=c(2,5,10,15,20,30)
> for(i in 1:6)
+ {x<-rchisq(n,df[i])
+ hist(x,xlim=c(0,60),prob=T,col="red",xlab=expression(chi^2),ylab="Density",main=paste("df=",df[i]))
+ curve(dchisq(x,df[i]),col="blue",add=T)}
#计算概率
> pchisq(10,df=15)
[1] 0.1802601
> 1-pchisq(15,df=25)
[1] 0.9413826
#计算分位数
> qchisq(0.95,df=10) #左值
[1] 18.30704
2、t分布
#画图
> curve(dnorm(x,0,1),from=-3,to=3,xlim=c(-4,4),ylab="f(x)",lty=1,col=1)
> abline(h=0)
> segments(0,0,0,dnorm(0),col="blue",lty=2)
> curve(dt(x,2),from=-4,to=4,add=T,lty=3,col=2)
> curve(dt(x,5),from=-4,to=4,add=T,lty=4,col=3)
#计算概率
> pt(-2,df=10)
[1] 0.03669402
> 1-pt(3,df=15)
[1] 0.004486369
#计算分位数
> qt(0.975,df=25) #左值
[1] 2.059539
3、F 分布
#画图
> curve(df(x,10,20),from=0,to=5,xlim=c(0,5),xlab="F",ylab="f(x)",lty=1,col=1)
> curve(df(x,5,10),from=0,to=5,add=T,lty=2,col=2)
> abline(h=0,v=0)
#计算概率
> pf(3,df1=10,df2=8)
[1] 0.9335491
> 1- pf(2.5,df1=18,df2=15)
[1] 0.03944963
#计算分位数
> qf(0.95,df1=25,df2=20) #左值
[1] 2.07392