如下所示,会将索引作为列移动到数据帧中。如果索引只是一个通用的数字索引,你可能不关心它,可以丢弃它。下面是一个简单的数据帧,但我删除了第一行只是为了在索引中具有不同的值。df.reset_index()
df = pd.DataFrame([['a', 10], ['b', 20], ['c', 30], ['d', 40]], columns=['letter','number'])
df = df[df.number > 10]
print(df)
# letter number
# 1 b 20
# 2 c 30
# 3 d 40
默认行为现在显示一个名为上一个索引的列。您可以看到它与上面的索引匹配,但索引已从 0 开始重新编号。index
df['index']
print(df.reset_index())
# index letter number
# 0 1 b 20
# 1 2 c 30
# 2 3 d 40
drop=True
不会假装索引很重要,只是给你一个新索引。
print(df.reset_index(drop=True))
# letter number
# 0 b 20
# 1 c 30
# 2 d 40
关于行顺序,我怀疑它会保持不变,但一般不应该依赖存储事物的顺序。如果要执行聚合函数,则可能需要确保为聚合正确排序数据。