R语言实战_第7章_基本统计分析

第7章 基本统计分析

1. 描述性统计分析

1. 方法云集
  1. 使用 summary() 函数获取描述性统计量
myvars <- c("mpg", "hp", "wt")
summary(mtcars[myvars])
  1. 使用第5章中 apply()sapply() 计算所选任意描述统计量

    sapply(x, FUN, options)
    
  2. 还可自行设计函数计算若干描述性统计量

mystats <- function(x, na.omit=FALSE){
    if (na.omit)
        x <- x[!is.na(x)]
    m <- mean(x)
    n <- length(x)
    s <- sd(x)
    skew <- sum((x-m)^3/s^3)/n
    kurt <- sum((x-m)^4/s^4)/n -3
    return(c(n=n, mean=m, stdev=s, skew=skew, kurtosis=kurt))
}
myvars <- c("mpg", "hp", "wt")
sapply(mtcars[myvars], mystats)
  1. 单纯地忽略缺失值

    sapply(mtcars[myvars], mystats, na.omit=TRUE)
    
2. 更多方法
  1. Hmisc 包中的 describe() 函数可返回变量和观测的数量、缺失值和唯一值得数目、平均值、分位数,以及五个最大的值和五个最小的值。
library(Hmisc)
myvars <- c("mpg", "hp", "wt")
describe(mtcars[myvars])
  1. pastecs 包中 stat.desc() 函数,可以计算种类繁多的描述性统计量

    stat.desc(x, basic=TRUE, desc=TRUE, norm=FALSE, p=0.95)
    
library(pastecs)
myvars <- c("mpg", "hp", "wt")
stat.desc(mtcars[myvars])
  1. psych 包中 describe() 函数,可以计算非缺失值的数量、平均数、标准差、中位数、截尾均值、绝对中位差、最小值、最大值、值域、偏度、峰度和平均值的标准误。
library(psych)
myvars <- c("mpg", "hp", "wt")
describe(mtcars[myvars])
3. 分组计算描述性统计量
  1. 使用 aggregate() 函数来分组获取描述性统计量
myvars <- c("mpg", "hp", "wt")
aggregate(mtcars[myvars], by=list(am=mtcars$am), mean)
aggregate(mtcars[myvars], by=list(am=mtcars$am), sd)
  1. aggregate() 函数仅允许每次调用中使用平均数、标准差这样的单返回值函数,无法一次返回若干统计量

  2. 使用 by() 函数可返回若干统计量

    by(data, INDICES, FUN)
    

    data

  • 2
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值