刚好用到这几个操作,复习下,加以记录。
有一个字典如下:
data = {
'A': [0, 1, 2, 3],
'B': [1, 2, 3, 4],
'C': [2, 3, 4, 5],
'D': [3, 4, 5, 6]
}
转换为数据框:
df = pd.DataFrame(data)
print(df)
- 删除列:
若要删除某一列,提供列名即可。
# 删除某一列,提供列名即可
del df['A']
print(df)
- 重命名列:
重命名列,需要操作列columns,由于列名为索引类型,不可变,故需转为可变对象进行操作:
# 重命名列,列名为索引类型,为不可变类型,故需先转为可变的索引再操作
columns = df.columns
columns = list(columns)
# 列表获取一个元素的索引
print(columns.index('B'))
columns[columns.index('B')] = 'A'
print(columns)
列名修改完毕,重新建立列索引即可:
df.columns = columns
print(df)
- 新增列:
保持列顺序不变,用reindex方法,调整好要插入的列位置即可。
columns.insert(columns.index('C'), 'B')
df = df.reindex(columns=columns)
print(df)