在执行数据分析前,数据预处理是必要的。数据集的合并是数据处理最常见的需求。
本篇涉及3个基本函数:
合并列:merge、cbind
合并行:rbind
接下来我们看看合并效果。
1)cbind
cbind可以记忆成column bind,即合并列;
cbind使用非常直观简单。当我们需要直接合并2个矩阵或数据框,不需要指定任何公共索引时,可以采用cbind函数
qcbind合并列
2)merge
merge函数合并列时需要指定数据集的共有变量。
merge合并示例1
当dataA与dataC的行数Sample列完全相同(元素和行数都相同)时,合并效果与cbind一样。
merge函数除了指定一列共有变量,也可以指定两列共有变量作为合并索引。
merge合并示例2
可以看到当指定两个共有变量时,合并会取共有变量行的交集。
merge合并示例3
3)rbind
rbind合并行示例1
两个数据集的变量必须相同,顺序可以不一致。合并后,结果会按照第一个数据集的变量次序展示。
在测试中,发现了一个值得注意的问题 --- 相同的变量,数据类型必须一致,否则会报错。如下,
rbind合并示例2
那么,以上就是常见的R合并函数。
当更复杂的时候,以上3个函数恐怕有些力不从心。这时候更强大的数据框整形工具reshape就能派上用场啦。关于reshape的用法,敬请关注后期文章啦啦啦~