dplyr学习笔记

本文介绍了R语言中的dplyr包,包括基础和高级函数的使用。内容涉及filter()行过滤,select()列选择,rename()变量重命名,arrange()数据排序,mutate()和transmute()数据扩展,以及summarise()数据汇总。此外,还提到了数据集的连接(join)操作,分组汇总(group_by)以及管道操作符的功能。
摘要由CSDN通过智能技术生成
#数据清理 ——dplyr package
  • 加载包
    library(dplyr)
    library(hflights) #hflights是2011年从休斯顿起飞的航班

  • 创建本地数据框
    tbl_df用于创建一个”local data frame”,相当于一个包装器,可以把data frame,sql数据类型转换成tbl对象。
    优势在于打印的时候显示比较智能化,根据显示屏分辨率来确定显示的变量个数。
    flights = tbl_df(hflights)
    flights

dplyr包基础函数:

  1. 行过滤filter():根据准则筛选行
    首参数是tbl对象;后面接着是筛选条件;返回也是一个data frame
    ##选择某一天的航班
    fliter(flights,Month==-1,DayofMonth==1)
    filter(flights,Month==1,DayofMonth==1) 等价于 flights[Month==1 & DayofMonth==1,]
    filter(flights,Month==1 & DepTime>1400)
    filter(flights,DepTime <1400| ArrTime > 1600 )

    To select rows by position, use slice():
    slice(flights,1:5) #只显示前五行

  2. select:根据名字选择变量列
    flight[,c(“DepTime”,”ArrTime”,”FlightNum”)]
    #dplyr
    select(flights

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值