有时候我们需要修改DataFrame的个别列名或者索引,避免重复、方便使用。
rename()函数使用时比较简单。
现有一个DataFrame:
现在想要把’销售’改成’10月销售’, ‘人员数量’改成‘10月人员数量’:
中间的 columns={‘销售’:’10月销售’,’人员数量’:’10月人员数量’} 也好理解:
1、 columns代表要对列名进行修改。在Python3 的pandas库里面,跟列名有关的一般都是用 columns,而不是用names。
2、在columns后面是一个字典形式,键代表原列名,值代表新列名。不需要修改的列名不需要列出来,她们不会被修改。
注意:这样操作后,原DataFrame是不会变的。
需要再次赋值一次哟。
也可以添加参数inplace=True来直接替换掉原有DataFrame,这样就不需要重新赋值了:
修改索引跟修改列名类似:
rename()函数适合于修改个别的索引或者列名,如果需要大部分或者全部修改的话,就用set_index(第5节)了。
还有最后一个问题:多层索引或者列名怎么修改?
回答是:我不用多层索引!!!建议你也别用!