R summarize+group_by分组摘要

本文介绍了如何在R语言中处理缺失值,包括使用`na.rm=TRUE`和`!is.na()`方法,并展示了如何进行计数、使用摘要函数。文章通过实例讲解了分组摘要操作,如计算平均延误时间、计数和画图表示,以及常见摘要统计量如位置度量、分散程度度量等。
摘要由CSDN通过智能技术生成

上一篇文章中写到了管道,这部分主要写一下处理缺失值,计数,常用的摘要函数,按多个变量分组和取消组。

一、处理缺失值

有两种比较好的方法:①使用na.rm=TRUE;②使用!is.na()

场景一:我们想计算一下飞机飞行距离及延误到达时间。

delay<- flights%>%
  group_by(dest)%>%
  summarize(
    count=n(),   #起到计数的作用
    dis = mean(distance),
    arr_delay = mean(arr_delay)
  )
delay

输出结果:

出现了很多NA,说明有些飞机是取消航班的,但也被记录了下来。

加个na.rm=TRUE会是什么样的呢?

delay<- flights%>%
  group_by(dest)%>%
  summarize(
    count=n(),   #起到计数的作用
    dis = mean(distance,na.rm=TRUE),
    arr_delay = mean(arr_delay,na.rm=TRUE)
  )
delay

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值