我有两个不同的数据框.首先,我必须检查df1中的数据是否与df2相匹配.如果是这种情况,它将添加一列“ isRep” = true,否则等于false.它为我创建了df3.
现在,我需要在df3中添加一个与索引相对应的“ idRep”列,并使用pandas自动生成,并在其中找到df2中的数据
这是df1:
Index Firstname Name Origine
0 Johnny Depp USA
1 Brad Pitt USA
2 Angelina Pitt USA
这是d2:
Index Firstname Name Origine
0 Kidman Nicole AUS
1 Jean Dujardin FR
2 Brad Pitt USA
与以下代码合并后:
df = pd.merge(data, dataRep, on=['Firstname', 'Name', 'Origine'], how='left', indicator='IsRep')
df['IsRep'] = np.where(df.IsRep == 'both', True, False)
在这段代码之后,我得到的结果是我的df3(与df1相同,但带有列“ isRep”):
Index Firstname Name Origine isRep
0 Johnny Depp USA False
1 Brad Pitt USA True
2 Angelina Pitt USA False
现在,我需要另一个带有名为“ idRep”的列的数据框,其中将索引对应于df2.但是我不知道该怎么做:
Index Firstname Name Origine isRep IdRep
0 Johnny Depp USA False -
1 Brad Pitt USA True 2
2 Angelina Pitt USA False -