R语言dplyr包:高效数据处理函数arrange、sample_n、n_distinct、select、compute等

今天是个特别的日子,小编在这里祝大家情人节快乐!本篇文章继续之前文章提到的关于dplyr包数据处理的函数。错了,小编是准备那天发的,忘发了

R语言在数据整理、分析上面的方法是很多的,并且通俗易懂,相信热衷于用R语言处理数据的同仁也深有体会。

1、数据排序函数

arrange()函数其实和大家经常用的EXCEL中的降序、升序相似,但该函数的功能肯定更便捷、强大,可以按照多列(有序的列)进行排序,函数的基本形式为arrange(data,var1,var2,var3,...),函数默认排序为升序,若需要按照某列降序排序,那么可以在变量名前加desc。

另外当变量众多的时候可以采用延伸的函数arrange_all(data)

下面以R中自带的数据集mtcars、iris为例:

arrange(mtcars,cyl,mpg)

arrange(iris,Sepal.Length,Sepal.Width)

 

2、样本(随机)选取函数

sample_n((tbl, size, replace = FALSE)

参数说明:tbl数据,size选取的数据行数,replace=true/false是否替换样本(主要参数)

sample_n(iris,8,replace=FALSE)

3、计算向量唯一值数量函数

n_distinct(...,na.rm=FALSE)函数是更快且简洁,等同于unique

参数说明:na.rm=FALSE缺失值不会计入

n_distinct(iris$Sepal.Length,na.rm=FALSE)

4、数据选取函数select

select(.data,...)函数按照名称选择变量,同时select中可以使用的函数有starts_with(), ends_with(), contains(),matches(),num_range(),one_of(),everything();rename(.data,...)函数重命名变量

select(mtcars,cyl:drat)
select(mtcars,starts_with("c"))
select(mtcars,contains("m"))

此外还有一些延伸的函数,也很实用select_all(), select_if() and select_at()) and rename_all(), rename_if(), rename_at()

当你越来越熟悉这些函数后,你会发现其实和SQL里面的操作同理,而dplyr包对于sql里面的功能很多都可以实现,在有时候更加高效,你也可以下载dplyr包的原文档,里面还有许多有意思的函数。

下一篇预告:tidyr包中的有趣函数,来一起修行啊

  • 10
    点赞
  • 68
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

LEEBELOVED

一分钱都是爱

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值