数据规整
索引与分层索引
索引
• 查看索引:df.index
• 指定索引:df.index = [,] 个数必须一致
• 重置索引:df.reindex([,]) 无需个数一致
• 指定某一列作为index:df.set_index(“M”,drop=False)
• 返回index的唯一值:df.set_index(“M”).index.unique()
• df.reset_index():将分层索引层级移动到列中
import pandas as pd
import numpy as np
df = pd.DataFrame(np.arange(12).reshape(3,4),index=list("ABC"),columns=list("MNOP"))
df
df.index[1] = "D" # 报错,索引不能单独赋值修改
df.reindex(["A","D"])
"""
df.set_index(keys,drop=True)
drop=True 指定该列为索引 并且删除该列数值
"""
df.set_index("M")
# df.set_index("M",drop=False)
# 将df中的4赋值为8
df.loc["B","M"] = 8
df
"""
当index重复后
返回的index唯一值
"""
# 设置M列为索引
df1 = df.set_index("M")
df1.loc[8,:]
df1.index.unique()