第六章 连接
一、关系型连接
1.连接的基本概念
左连接,右连接,内连接,外连接。
左连接就是以左边表里的键为准,如果右边表里出现左表利的键,就添加到左表里,否则就不添加。
内连接:只合并两个表里同时出现的键。
!如果 出现重复的键怎么处理?
原则:只要两边同时出现的键,就以笛卡尔积的方式加入,如果单边出现则根据连接的形式加入。
小结:
left:参与合并的左侧DataFrame
right:参与合并的右侧DataFrame
how:inner、outer、left、right其中之一
2. 值连接
两张表根据某一列的值来连接,事实上还可以通过几列值的组合进行连接,这种基于值的连接在pandas中可以由merge函数实现,例如:
df1 = pd.DataFrame({
'Name':['San Zhang','Si Li'], 'Age':[20,30]})
df2 = pd.DataFrame({
'Name':['Si Li','Wu Wang'], 'Gender':['F','M']