R语言实战_第7章_基本统计分析

最新推荐文章于 2021-12-31 00:10:15 发布

Benjamin.Zing

最新推荐文章于 2021-12-31 00:10:15 发布

阅读量1.3k

点赞数 2

分类专栏： R语言文章标签： R语言实战学习笔记

本文链接：https://blog.csdn.net/weixin_44847474/article/details/95225701

版权

第7章基本统计分析

1. 描述性统计分析

1. 方法云集

使用 summary() 函数获取描述性统计量

myvars <- c("mpg", "hp", "wt")
summary(mtcars[myvars])

使用第5章中 apply() 或 sapply() 计算所选任意描述统计量
```
sapply(x, FUN, options)
```
还可自行设计函数计算若干描述性统计量

mystats <- function(x, na.omit=FALSE){
    if (na.omit)
        x <- x[!is.na(x)]
    m <- mean(x)
    n <- length(x)
    s <- sd(x)
    skew <- sum((x-m)^3/s^3)/n
    kurt <- sum((x-m)^4/s^4)/n -3
    return(c(n=n, mean=m, stdev=s, skew=skew, kurtosis=kurt))
}
myvars <- c("mpg", "hp", "wt")
sapply(mtcars[myvars], mystats)

单纯地忽略缺失值

sapply(mtcars[myvars], mystats, na.omit=TRUE)

2. 更多方法

Hmisc 包中的 describe() 函数可返回变量和观测的数量、缺失值和唯一值得数目、平均值、分位数，以及五个最大的值和五个最小的值。

library(Hmisc)
myvars <- c("mpg", "hp", "wt")
describe(mtcars[myvars])

pastecs 包中 stat.desc() 函数，可以计算种类繁多的描述性统计量
```
stat.desc(x, basic=TRUE, desc=TRUE, norm=FALSE, p=0.95)
```

library(pastecs)
myvars <- c("mpg", "hp", "wt")
stat.desc(mtcars[myvars])

psych 包中 describe() 函数，可以计算非缺失值的数量、平均数、标准差、中位数、截尾均值、绝对中位差、最小值、最大值、值域、偏度、峰度和平均值的标准误。

library(psych)
myvars <- c("mpg", "hp", "wt")
describe(mtcars[myvars])

3. 分组计算描述性统计量

使用 aggregate() 函数来分组获取描述性统计量

myvars <- c("mpg", "hp", "wt")
aggregate(mtcars[myvars], by=list(am=mtcars$am), mean)
aggregate(mtcars[myvars], by=list(am=mtcars$am), sd)

aggregate() 函数仅允许每次调用中使用平均数、标准差这样的单返回值函数，无法一次返回若干统计量
使用 by() 函数可返回若干统计量
```
by(data, INDICES, FUN)
```
data

最低0.47元/天解锁文章

Benjamin.Zing

关注

2
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
R语言实战_第7章_基本统计分析

第7章基本统计分析1. 描述性统计分析1. 方法云集使用 summary() 函数获取描述性统计量myvars <- c("mpg", "hp", "wt")summary(mtcars[myvars])使用第5章中 apply() 或 sapply() 计算所选任意描述统计量sapply(x, FUN, options)还可自行设计函数计算若干描述性统计量...
复制链接

扫一扫