dplyr tidyr pipe管道 %>%介绍

dplyr是R中着名的plyr包的下一个版本,用来处理转换数据,
tidyr用来获得整洁(tidy)的数据;
%>%最初在封装magrittr中引入的管道操作器,现在这两个包中都受支持并且非常容易上瘾。
我们将会知道代码中(){}的区别。

我们将首先讨论管道运算符(%>%)。

R管道: %>%

在代码中频繁使用管道可以极大地提高代码的整洁度。它有助于避免在代码中不必要地使用临时变量。

基本含义%>%是:

R管道代码等效代码
x %>% ff(x)
x %>% f(y)f(x,y)
x %>% f(.,y)f(x,y)
x %>% f(y,.)f(y,x)
x %>% f(y, z = .)f(y,z=x)
x %>% f %>% gg(f(x))
z <- x %>% fz <- f(x)

请注意,x左侧的变量%>%将作为右侧函数中的第一个参数应用。可以使用点(.)称为占位符的默认行为进行更改。

但是,要记住的一件重要事情是,当.嵌套表达式中出现时,仍会应用第一个参数规则。但是使用花括号可以抑制此行为{ }。如下,

R管道代码等效代码
data %>% f(x = ncol(.))f(data, x = ncol(data))
data %>% { f(x = ncol(.)) }f(x = ncol(data))

dplyr包

该软件包提供了直观的“动词”,可用于处理R中的数据帧(例如:用于子集化,汇总,重新排列数据帧)。

dplyr包的基本动词/功能是:

dplyr动词含义
select()只保留你提到的列
rename()重命名您提到的列
mutate()添加新列并保留现有列
filter()返回具有匹配条件的行的子集
arrange()重新排序行

tidyr

该软件包提供动词来清理/整理数据。
这里的主要动词有:

tidyr动词含义
gather()使数据更长
spread()使长数据更广泛
unite()将多列粘贴到一起
separate()将一列拆分成几列
  • 2
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值