如何在R data.table包中使用.SD

本文介绍了如何在R的data.table包中使用.SD符号进行分组操作。通过实例展示了如何根据用户类型和年份筛选数据,以及如何计算每个月和每个用户类型旅行次数最多的一天。内容涵盖了数据导入、数据表的初步查看,以及使用.SD进行分组和聚合的基本用法。
摘要由CSDN通过智能技术生成

对于某些data.table用户,“ dot-SD”有点神秘。 但是data.table的创建者Matt Dowle告诉我,它实际上非常简单:只需将其视为代表“每个组”的符号即可。 让我们来看几个例子。

我有一个来自波士顿地区自行车共享系统的每日自行车旅行数据集。 如果您想继续,可以从本文底部的链接下载CSV文件。

我将加载data.table并使用data.table的fread()函数导入CSV文件。 在下面的代码中,我将数据保存到名为mydt的数据表中。

library(data.table)
mydt <- fread("daily_cycling_trips_by_usertype.csv")

接下来,我建议使用head(mydt)打印前六行,以查看数据的外观。 您会看到数据中包含日期,用户类型(订户或单程客户),行程数,年份和月份开始日期的列,以按月汇总。

Matt建议的第一个示例:打印按用户类型分组的数据表的前几行。 (我们正在过滤前12行,只是为了更容易看到输出)。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值