R语言基本描述性统计量函数

summary,fivenum,sapply,aggregate, by

1. summary

summary()函数提供了最小值、最大值、四分位数和数值型变量的均值,以及因子向量和逻

辑型向量的频数统计。

# colnames(mtcars)
vars <-c("mpg","hp","wt")
head(mtcars[vars])

# dataframe
summary(mtcars[vars])

a<- c(1,2,NA,3,4,6,NA)
summary(a)

# 只取不为缺省值的数据
a<- a[!is.na(a)]
summary(a)

2. fivenum

函数fivenum()可返回图基五数总括(Tukey’s five-number summary,即最小值、

下四分位数、中位数、上四分位数和最大值.

fivenum(mtcars$mpg)
fivenum(1:100)

3. sapply

# sapply(x,FUN,option)

vars <-c("mpg","hp","wt")
sapply(mtcars[vars],mean)

lst <- list(A=c(1,2,NA,3,4,6,NA),B=c(10,20,30,40,NA))
sapply(lst,mean,na.rm=TRUE)

4.aggregate

aggregate分组计算描述性统计量。

#单个分组变量
aggregate(mtcars[vars],by=list(cyl=mtcars$cyl,am=mtcars$am),mean,na.rm=TRUE)

#多个分组变量
aggregate(mtcars[vars],by=list(cyl=mtcars$cyl,am=mtcars$am),mean,na.rm=TRUE)

5. by

aggregate()仅允许在每次调用中使用平均数、标准差这样的单返回值函数。

它无法一次返回若干个统计量。要完成这项任务,可以使用by()函数。

Usage

by(data, INDICES, FUN, ..., simplify = TRUE)
dstats <- function(x)(c(mean=mean(x),sd=sd(x)))
by(mtcars$disp,mtcars$cyl,dstats)

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值