r语言rank降序_R数据科学笔记(四)

本文介绍了R语言dplyr包的基础知识,包括tibble数据框、变量类型以及核心函数如filter()、arrange()、select()、mutate()和summarize()。重点讲解了如何进行数据筛选、排序和变量选择,并提到了管道函数%>%的使用及其背后的编程理念。此外,还讨论了dplyr中的一些辅助函数和特殊功能,如between()、one_of()以及管道操作符的适用场景和限制。
摘要由CSDN通过智能技术生成

aceea9d62aeed8f224c61fbfd88201aa.png

dplyr基础

tibble也是一种数据框, 只是进行了一些小小的修改,使其更适合在 tidyverse 中使用。

变量类型:

  • int 表示整数型变量。
  • dbl 表示双精度浮点数型变量,或称实数。
  • chr 表示字符向量,或称字符串。
  • dttm 表示日期时间(日期 + 时间)型变量。
  • lgl 表示逻辑型变量,是一个仅包括 TRUE 和 FALSE 的向量。
  • fctr 表示因子,R用其来表示具有固定数目的值的分类变量。
  • date 表示日期型变量。

dplyr 核心函数

  • 按值筛选观测(filter())——可以基于观测的值筛选出一个观测子集。
  • 对行进行重新排序(arrange())—— 改变行的顺序,使用 desc() 可以按列进行降序排序,缺失值总是排在最后。
  • 按名称选取变量(select())——select() 函数可以让你快速生成一个有用的变量子集。
  • 使用现有变量的函数创建新变量(mutate())——需要添加新列,新列是现有列的函数。
  • 将多个值总结为一个摘要统计量(summarize())——进行分组摘要,如果不与 group_by() 一起使用
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值