R中的数据重整是关于将数据组织成行和列的方式。
R中的大多数时间数据处理是通过将输入数据作为数据帧来完成的。
我们很容易从数据帧的行和列中提取数据,但是有些情况下,我们需要的格式与收到的格式不同。
R具有许多函数,用于在数据帧中拆分,合并和更改行到列,反之亦然。
我们可以使用cbind()
函数连接多个向量来创建数据帧,也可以使用rbind()
函数合并两个数据帧,如下:
输出结果为:
我们可以使用merge()
函数合并两个数据帧,不过,数据帧必须具有相同的列名称,合并发生。
在下面的例子中,我们考虑了Pima印度妇女的糖尿病数据库,可以在名称为“MASS”
的库中找到。 我们根据血压值(“bp”
)和体重指数(“bmi”
)合并两个数据集。 在选择这两列进行合并时,这两个变量的值在两个数据集中匹配的记录被组合在一起以形成单个数据帧,如下:
输出结果为:
R编程最有趣的一个方面是在多个步骤中改变数据的形状以获得所需的形状,用于执行此操作的函数称为melt()
和cast()
,如下:
输出结果为:
接下来,我们将数据融合到一起,将除了类型和年份之外的所有列转为行,如下:
输出结果为:
我们还可以将拆分的数据转换为一种新形式,使用cast()
函数创建每年每种类型的船的总和,如下:
输出结果为:
好啦,本次记录就到这里了。
如果感觉不错的话,请多多点赞支持哦。。。