【R语言数据科学】:(五)data.table库(数据处理)

本文介绍了R语言中的data.table库在数据处理中的应用,包括数据表操作、选择列、添加/改变列、引用与复制、索引、数据描述性统计、分组统计和排序。重点讲解了data.table相比于dplyr包的优势,如内存效率和直接使用索引等特性。
摘要由CSDN通过智能技术生成

R语言数据分析


参考资料:
Data Analysis and Prediction Algorithms with R

5.data.table

data.table库是用于数据整理和分析的,在第三章中我们介绍了dplyr包来进行数据处理。本章介绍在data.table中如何实现相同的功能

5.1 操作数据表

data.table是一个单独的库。需要单独安装导入。本章介绍一些与第三章:R语言数据处理相关的方法:
mutate,filter,select,group_by

首先我们使用setDT函数将数据框装换为一个data.table,否则 后面的操作可能会失效

library(tidyverse)
library(data.table)
library(dslabs)
murders <- copy(murders)
murders <- setDT(murders)
<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

JOJO数据科学

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值