假设我有一个DataFrame :>>> df = pd.DataFrame({'a1':[1,2],'a2':[3,4],'b1':[5,6],'b2':[7,8],'c':[9,0]})
>>> df
a1 a2 b1 b2 c
0 1 3 5 7 9
1 2 4 6 8 0
>>>
我想合并(可能不合并,但是连接它)的第一个名字字母相等的列,比如,a1和a2等。 但是有一个c列没有其他类似的列,因此我希望不抛出错误,而是将NaN添加到它们。
我想将宽DataFrame变成长DataFrame,以这种方式合并它。
我已经有了问题的解决方案,唯一的问题是效率非常低,我想要一个更高效,更快的解决方案(与我的不同),我目前有一个for循环和try except(呃,听起来很糟糕)的代码:>>> df2 = pd.DataFrame()
>>> for i in df.columns.str[:1].unique():
try:
df2[i] = df[[x for x in df.columns if x[:1] == i]].values.flatten()
except:
l = df[[x for x in df.columns if x[:1] == i]].values.flatten().tolist()
df2[i] = l + [pd.np.nan] * (len(df2) - len(l))
>>> df2
a b c
0 1 5 9.0
1 3 7 0.0
2 2 6 NaN
3 4 8 NaN
>>>
我想用更好的代码获得相同的结果。