columns overlap but no suffix specified: Index([‘data1‘, ‘data2‘], dtype=‘object‘)解决方法

最新推荐文章于 2022-11-15 10:27:48 发布

ElegantCodingWH

最新推荐文章于 2022-11-15 10:27:48 发布

阅读量4.5w

点赞数 9

分类专栏：随笔 # Pandas 文章标签： join

本文链接：https://blog.csdn.net/qq_43546676/article/details/98611306

版权

随笔同时被 2 个专栏收录

25 篇文章

订阅专栏

Pandas

14 篇文章

订阅专栏

本文详细解析了在使用Pandas进行DataFrame join操作时遇到的columnsoverlapbutnosuffixspecified错误，阐述了错误原因在于列名重复，并提供了两种解决方法：一是通过修改列名，二是使用add_prefix为列名添加前缀。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

记录一下错误：

columns overlap but no suffix specified: Index(['data1', 'data2'], dtype='object')

首先说明该错误是由于使用pandas中的join方法连接两个DataFrame出现的错误。
错误原因：列名重复
解决方法：修改列名，使其不重名

df = pd.DataFrame({'data1':np.random.rand(5),
                  'data2':np.random.rand(5),
                  'key1':list('aabba'),
                  'key2':['one','two','one','two','one']})
print(df)

# 如果要将df分组后求其平均数，并添加到末尾，有以下两种方法
# 1. 常规方法
df_mean = df.groupby('key1').mean()
print(df_mean)
print(pd.merge(df, df_mean, how='inner', left_on='key1', right_index=True))

# 2.用transform
a = df.groupby('key1').transform(np.mean)
print(a)
print(df.join(a, how='inner'))

执行最后一句语句时报错columns overlap but no suffix specified: Index(['data1', 'data2'], dtype='object'),然后发现是两个DataFrame 的列名重复了，join不会像merge一样，merge会将重名的列明自动加上_x,_y加以区分，而join直接报错。
所以，我们的解决方法是修改其列明就好了。

常用的有两种方法：
1.用column修改列名

a = df.groupby('key1').transform(np.mean)
print(a)
a.columns = ['a', 'b']
print(df.join(a, how='inner'))

2.用add_profix为列名添加指定字符串前缀

a = df.groupby('key1').transform(np.mean).add_prefix('mean_')
print(a)
print(df.join(a, how='inner'))