3.1某单位对100名女生测定血清蛋白含量(g/L),数据见附表:
计算均值、方差、方差标准差、极差、标准误、变异系数、偏度、峰度。
>library("moments")
>myData<-read.csv("exercise3.1.csv",head=F)
>myData<-unlist(as.list(myData))
>data.mean<-mean(myData) #均值
> data.mean
[1] 73.668
> data.var<-var(myData) #方差
> data.var
[1] 15.51513
> data.sd<-sd(myData) #标准差
> data.sd
[1] 3.938925
> #标准误 = 标准误差/根号100
>data.serror<-data.sd/sqrt(100) #标准误
> data.serror
[1] 0.3938925
> data.jc<-max(myData)-min(myData) #极差
> data.jc
[1] 20
>data.byxs<-data.var/data.mean #变异系数
> data.byxs
[1] 0.2106088
> data.bia<-skewness(myData) #偏度
> data.bia
[1] 0.05324501
> data.pea<-kurtosis(myData) #峰度
> data.pea
[1] 2.975791
3.2绘出习题3.1的直方图、密度估计曲线、经验分布图和QQ图,并将密度估计曲线与正态密度曲线相比较,将经验分布曲线与正态分布曲线相比较(其中正态分布曲线的均值和标准差取习题3.1计算出的值)。
> hist(myData,freq=F) #直方图
>lines(density(myData),col=”red”) #密度估计曲线
>X<-64:86
>lines(X,dorm(X,data.mean,data.sd),col=”blue”) #正态密度曲线
>#经验分布图
> plot.ecdf(myData,verticals=TRUE,do.p=FALSE,main="Empiricaldistribution map")
>X<-64:85
> lines(X,pnorm(X,data.mean,data.sd),col="purple") #正态分布曲线
>qqnorm(myData) #QQ图
>qqline(myData,col = "red")
3.3绘出习题3.1的茎叶图、箱线图、并计算五数总括。
> stem(myData) #茎叶图
Thedecimal point is at the |
64| 300
66| 23333
68| 00888777
70| 344444442222
72| 0000000777777555555555555
74| 33333333700000004688888
76| 5555555226
78| 0888555
80| 355266
82|
84| 3
> fivenum(myData) #五数总括
V44 V65 V69 V53 V710
64.3 71.2 73.5 75.8 84.3
>boxplot(myData,col=”lightblue”,notch=T,main="Boxplot ofData") #箱线图
3.7某校测得19名学生的四项指标,性别、年龄、身高(cm)和体重(磅),具体数据由表3.9所示,(1)试绘出体重对于身高的散点图;(2)绘出不同性别情况下,体重与身高的散点图;(3)绘出不同年龄段的体重与身高的散点图;(4)分不同性别和不同年龄段的体重与身高的散点图。数据见附表。
> myData2<-read.csv("exercise3.7.csv")
> attach(myData2)
The following objects are masked from myData2 (pos = 3):
年龄, 身高, 体重, 性别, 姓名, 学号
> plot(身高,体重,xlab = "height",ylab="weight",main="heightand weight")
> coplot(身高~体重|性别) #不同性别,身高和体重的散点图
> coplot(身高~体重|年龄) #不同年龄身高和体重的散点图
> coplot(身高~体重|性别*年龄)
> #在不同性别和不同年龄下的身高和体重的散点图
|
||