set_index()
官方定义:
使用一个或多个现有列设置索引, 默认情况下生成一个新对象
DataFrame.set_index(keys, drop=True, append=False, inplace=False, verify_integrity=False)
drop:默认为true,表示是否删除列作为新索引。
append:是否增加列到原来的索引上。
inplace:是否创建一个新的dataframe
单索引:
复合索引:
reset_index()
DataFrame.
reset_index
(level=None, drop=False, inplace=False, col_level=0, col_fill='')
http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.reset_index.html
示例:
实际中在操作“读取旧表,生成新表”的过程中,会出现对上一表的index不覆盖,旧index变成了新表的中的一列“Unnamed:0”(很蠢的操作),推荐每次要打印head(),查看index,是否变化,最好使用
train2=train2.reset_index(drop=True) # 通过reset_index(drop=True)删除原行索引,同时要传给train2!!!