刚刚接触R语言,学习了入门基础知识后,发现R语言深似海,依次总结记录自己R语言学习过程。
今天主要是利用R语言进行描述性统计分析。以R中自带的mtcars数据集为例。
1.利用psych包中的describe()函数计算,只能计算非逻辑、因子、字符的数值型变量。(?psych中阅读详细资料)
其中na.rm是移除含缺失值的行,type是选择估计偏度和峰度的方法,IQR是四分位范围,其他。。。。。
代码如下:
> vars<-c("mpg","hp","wt")
> describe(mtcars[vars],IQR=TRUE)
结果如下:第一行依次是变量,值的数量,平均数,标准差,中位数,截尾均值,绝对中位差,最小值,最大值,值域,偏度,峰度,平均值的标准误,及四分位范围。
vars n mean sd median trimmed mad min max range skew kurtosis
mpg 1 32 20.09 6.03 19.20 19.70 5.41 10.40 33.90 23.50 0.61 -0.37
hp 2 32 146.69 68.56 123.00 141.19 77.10 52.00 335.00 283.00 0.73 -0.14
wt 3 32 3.22 0.98 3.33 3.15 0.77 1.51 5.42 3.91 0.42 -0.02
se IQR
mpg 1.07 7.38
hp 12.12 83.50
wt 0.17 1.03
2.利用CrossTable生成二维列联表,具体参考(?CrossTable)
CrossTable(mtcars$disp,mtcars$cyl,prop.r = FALSE,prop.c = FALSE,prop.t = FALSE,prop.chisq = TRUE,chisq = TRUE)
Cell Contents
|-------------------------|
| N |
| Chi-square contribution |
|-------------------------|
Total Observations in Table: 32
| mtcars$cyl
mtcars$disp | 4 | 6 | 8 | Row Total |
-------------|-----------|-----------|-----------|-----------|
71.1 | 1 | 0 | 0 | 1 |
| 1.253 | 0.219 | 0.438 | |
-------------|-----------|-----------|-----------|-----------|
75.7 | 1 | 0 | 0 | 1 |
| 1.253 | 0.219 | 0.438 | |
-------------|-----------|-----------|-----------|-----------|
78.7 | 1 | 0 | 0 | 1 |
| 1.253 | 0.219 | 0.438 | |
-------------|-----------|-----------|-----------|-----------|
79 | 1 | 0 | 0 | 1 |
| 1.253 | 0.219 | 0.438 | |
-------------|-----------|-----------|-----------|-----------|
95.1 | 1 | 0 | 0 | 1 |
| 1.253 | 0.219 | 0.438 | |
-------------|-----------|-----------|-----------|-----------|
108 | 1 | 0 | 0 | 1 |
| 1.253 | 0.219 | 0.438 | |
-------------|-----------|-----------|-----------|-----------|
120.1 | 1 | 0 | 0 | 1 |
| 1.253 | 0.219 | 0.438 | |
-------------|-----------|-----------|-----------|-----------|
120.3 | 1 | 0 | 0 | 1 |
| 1.253 | 0.219 | 0.438 | |
-------------|-----------|-----------|-----------|-----------|
121 | 1 | 0 | 0 | 1 |
| 1.253 | 0.219 | 0.438 | |
-------------|-----------|-----------|-----------|-----------|
140.8 | 1 | 0 | 0 | 1 |
| 1.253 | 0.219 | 0.438 | |
-------------|-----------|-----------|-----------|-----------|
145 | 0 | 1 | 0 | 1 |
| 0.344 | 2.790 | 0.438 | |
-------------|-----------|-----------|-----------|-----------|
146.7 | 1 | 0 | 0 | 1 |
| 1.253 | 0.219 | 0.438 | |
-------------|-----------|-----------|-----------|-----------|
160 | 0 | 2 | 0 | 2 |
| 0.688 | 5.580 | 0.875 | |
-------------|-----------|-----------|-----------|-----------|
167.6 | 0 | 2 | 0 | 2 |
| 0.688 | 5.580 | 0.875 | |
-------------|-----------|-----------|-----------|-----------|
225 | 0 | 1 | 0 | 1 |
| 0.344 | 2.790 | 0.438 | |
-------------|-----------|-----------|-----------|-----------|
258 | 0 | 1 | 0 | 1 |
| 0.344 | 2.790 | 0.438 | |
-------------|-----------|-----------|-----------|-----------|
275.8 | 0 | 0 | 3 | 3 |
| 1.031 | 0.656 | 2.170 | |
-------------|-----------|-----------|-----------|-----------|
301 | 0 | 0 | 1 | 1 |
| 0.344 | 0.219 | 0.723 | |
-------------|-----------|-----------|-----------|-----------|
304 | 0 | 0 | 1 | 1 |
| 0.344 | 0.219 | 0.723 | |
-------------|-----------|-----------|-----------|-----------|
318 | 0 | 0 | 1 | 1 |
| 0.344 | 0.219 | 0.723 | |
-------------|-----------|-----------|-----------|-----------|
350 | 0 | 0 | 1 | 1 |
| 0.344 | 0.219 | 0.723 | |
-------------|-----------|-----------|-----------|-----------|
351 | 0 | 0 | 1 | 1 |
| 0.344 | 0.219 | 0.723 | |
-------------|-----------|-----------|-----------|-----------|
360 | 0 | 0 | 2 | 2 |
| 0.688 | 0.438 | 1.446 | |
-------------|-----------|-----------|-----------|-----------|
400 | 0 | 0 | 1 | 1 |
| 0.344 | 0.219 | 0.723 | |
-------------|-----------|-----------|-----------|-----------|
440 | 0 | 0 | 1 | 1 |
| 0.344 | 0.219 | 0.723 | |
-------------|-----------|-----------|-----------|-----------|
460 | 0 | 0 | 1 | 1 |
| 0.344 | 0.219 | 0.723 | |
-------------|-----------|-----------|-----------|-----------|
472 | 0 | 0 | 1 | 1 |
| 0.344 | 0.219 | 0.723 | |
-------------|-----------|-----------|-----------|-----------|
Column Total | 11 | 7 | 14 | 32 |
-------------|-----------|-----------|-----------|-----------|
Statistics for All Table Factors
Pearson's Chi-squared test
------------------------------------------------------------
Chi^2 = 64 d.f. = 52 p = 0.1228287
对参数进行设置还可以进行独立性检验及期望和残差的计算