目录
摘要
最近学习了《R数据科学》里的合并连接内容,这里直接用中文的表格来分析一下,可能更好理解。欢迎指正,谢谢。
函数介绍
四种函数都是用于组合两个表格的工具,对应四种连接方式,形式都是***_join(x,y,by=‘key’)
inner_join()
等值连接:两个观测的键是相等的,就可以匹配
left_join()
左连接:保留x中的所有观测
right_join()
右连接:保留y中的所有观测
full_join()
全连接:保留x和y中的所有观测
实例
是不是不知所云?没关系,直接看例子,这里采用内容为中文的数据框更容易理解。
假设有两个班级的考试名次表,class1和class2,然后将通过四种方式组合这两个表,来达到不同要求比较的目的。为了方便观察,除了代码及输出结果外,每一个新的组合后的表都会通过view展现一下。
class1<-tribble(
~'名次',~'姓名',
'第一名','王某人',
'第二名','张周人',
'第三名','李某人'
)
class2<-tribble(
~'名次',~'姓名',
'第一名','胡某人',
'第二名','刘周人'