用到了reset_index,突然看到还有个reindex,查了下区别,记录下。
reindex :
重新设置df中的index,注意这个index并不是指 每列之前的那个index,指的是每个列名。
例如图一是 合并之后的一个 df,可以看到他的index是乱的,这时候我们调用
result2 = result.reindex(columns=['A','C'])
就得到了图二,因为原df中没有C这个列,所以reindex之后C列的值都为Nan了
reset_index:
意思是合并之后或者条件选择之后的df index往往都是混乱的,这时候调用这个重新生成顺序的index
当我们合并了两个df之后,就会发现他们的index是乱的,这个时候就可以调用reset_index,这里面还可以传入图中这几个参数,例如设置drop=True 就可以舍弃原来的index 重新设置index
图一仍然是合并之后的数据,图二是调用
result2= result.reset_index()
而图三则是调用
result2 = result.reset_index(drop=True)