数据规整
pd.merge()
如果没有对应的key值,而索引可以对应,可以设置按索引链接:
需要着重记住 left_on 和 right_index 两个参数
join()
要求两组数据没有重叠的列
pd.concat()
np.concatenate()
pd.cancat()
- 默认axis = 0
- join默认为outer
- Series合并时查看索引有无重复
pd.concat([data1,data2],axis = 1)
stack() unstack()
将多层索引转换为Series
r = data.stack()
转变回去
r.unstack()
r.unstack(1)
r.unstack(‘姓名’)
可以指定 0 或者 1 来指定分层的依据
也可以指定行和列的name值 来达到同样的效果
stack()
默认过滤na值,如果不想过滤,可以填入参数 dropna = False