在数据分析和处理中,经常需要将不同的数据框进行合并,并选择特定的列进行分析。
data = pd.merge(data, df, on=['sku'], how='left', suffixes=['', '_r'])
data['平台佣金率'] = data['平台佣金率_r']
data['采购价'] = data['采购价_r']
data['实重'] = data['实重_r']
data = data.loc[:, columns]
data = data[data['sku'] != '']
df = data.loc[:, ['sku']]
- 使用
pd.merge()
函数将data
和df
数据框根据'sku'列进行左连接合并,合并后的数据框保存在data
变量中。 - 通过赋值语句,将合并后的数据框中的'平台佣金率_r'列的值复制给新的'平台佣金率'列,将'采购价_r'列的值复制给新的'采购价'列,将'实重_r'列的值复制给新的'实重'列。
- 使用
data.loc[:, columns]
选择特定的列,将结果保存在data
变量中。 - 过滤掉'sku'为空的行,也就是通过
data[data['sku'] != '']
进行筛选,并将结果重新赋值给data
变量。 - 最后,使用
data.loc[:, ['sku']]
选择特定的列,将结果保存在df
变量中。