目录
1. 数学统计函数
R语言中有许多基于概率论的数学统计函数。这里主要讨论R中的概率分布函数,R中有将近20种不同分布的函数它们都有几种前缀,其中d开头代表其是概率密度函数,p开头是分布函数,q开头是分布函数的反函数,r开头是产生满足该分布的随机数,在d、p、q、r后面加上相应分布的名称就构成了相应的函数例如r+binomial->rbinom()表示的就是生成二项分布的随机数的函数
分布 | 随机数 | 概率密度 | 分布函数 | 分位数函数 |
正态分布 | rnorm | dnorm | pnorm | qnorm |
二项分布 | rbinom | dbinom | pbinom | qbinom |
负二项分布 | rnbinom | dnbinom | pnbinom | qnbinom |
几何分布 | rgeom | dgeom | pgeom | qgeom |
超几何分布 | rhyper | dhyper | phyper | qhyper |
F分布 | rf | df | pf | qf |
泊松分布 | rpois | dpois | ppois | qpois |
t分布 | rt | dt | pt | qt |
连续均匀分布 | runif | dunif | punif | qunif |
2. 描述性统计函数
2.1 summary()
summar函数会告诉我们数据的最值、中位数、平均数、四分位数,非常方便
> m<-mtcars[c("mpg","hp","wt","am")]
> summary(m)
mpg hp wt am
Min. :10.40 Min. : 52.0 Min. :1.513 Min. :0.0000
1st Qu.:15.43 1st Qu.: 96.5 1st Qu.:2.581 1st Qu.:0.0000
Median :19.20 Median :123.0 Median :3.325 Median :0.0000
Mean :20.09 Mean :146.7 Mean :3.217 Mean :0.4062
3rd Qu.:22.80 3rd Qu.:180.0 3rd Qu.:3.610 3rd Qu.:1.0000
Max. :33.90 Max. :335.0 Max. :5.424 Max. :1.0000
2.2 fivenum ()
fivenum函数功能与summary类似,不过是针对某一列,从左到右依次从最小值到最大值
> fivenum(m$mpg)
[1] 10.40 15.35 19.20 22.80 33.90
2.3 describe()
describe函数会告诉你最值和缺失值数目等
> describe(m)
m
4 Variables 32 Observations
------------------------------------------------------------------------------
mpg
n missing distinct Info Mean Gmd .05 .10
32 0 25 0.999 20.09 6.796 12.00 14.34
.25 .50 .75 .90 .95
15.43 19.20 22.80 30.09 31.30
lowest : 10.4 13.3 14.3 14.7 15.0, highest: 26.0 27.3 30.4 32.4 33.9
------------------------------------------------------------------------------
hp
n missing distinct Info Mean Gmd .05 .10
32 0 22 0.997 146.7 77.04 63.65 66.00
.25 .50 .75 .90 .95
96.50 123.00 180.00 243.50 253.55
lowest : 52 62 65 66 91, highest: 215 230 245 264 335
------------------------------------------------------------------------------
wt
n missing distinct Info Mean Gmd .05 .10
32 0 29 0.999 3.217 1.089 1.736 1.956
.25 .50 .75 .90 .95
2.581 3.325 3.610 4.048 5.293
lowest : 1.513 1.615 1.835 1.935 2.140, highest: 3.845 4.070 5.250 5.345 5.424
------------------------------------------------------------------------------
am
n missing distinct Info Sum Mean Gmd
32 0 2 0.724 13 0.4062 0.498
------------------------------------------------------------------------------
>