问题:现在有两个DataFrame,第一个我们命名为df1,第二个我们命名为df2。两个DataFrame中各有一列数据,我需要横向判断这两列的数据是否相同(即:判断df1的第1行和df2的第1行是否相同,df1第2行和df2第2行是否相同,依次类推),网上查看了一些解决办法,有的用循环遍历等都感觉不太正确,因为数据量太大也没办法验证.
import pandas as pd
import numpy as np
1、当数据长度相同时
df1 = pd.DataFrame({
'col1':['a','b']})
df2 = pd.DataFrame({
'col2':['a','c']})
df = pd.concat([df1, df2], axis=1)
df['result'] = np.where(df['col1']==df['col2'],'same','different')
df
2、当数据长度不同时
df1 = pd.DataFrame({
'col1':['a','b']})
df2 = pd.DataFrame({
'col2':['a','c','b']})
df