今天在做数据清洗的时候遇到一个小问题,就是pandas DataFrame 中去重后index不连续,那么我们应该如何写代码让他变得连续呢?一起跟我学一下~
如图:
如我注释所写,去重后实际有931条,但是索引值最后还是963,那么对于这种数据量比较大的,我们不能手动一个个改,那么应该怎么操作呢?
一行就搞定:
pd_pitsA_Subnew = pd_pitsA_Sub_.reset_index(drop=True)
pd_pitsA_Subnew
这是我的两行代码,主要就是第一行。第二行是查看数据用的
这里用的就是.reset_index(drop=True),前面的部分大家自己替换成你命名的就可以~
现在我们来看一下数据吧,索引0-930一共931条数据,学会了吗?