pandas中DataFrame修改index、columns名的方法

一般常用的有两个方法:
1、使用DataFrame.index = [newName],DataFrame.columns = [newName],这两种方法可以轻松实现。
2、使用rename方法(推荐):
DataFrame.rename(mapper = None,index = None,columns = None,axis = None,copy = True,inplace = False,level = None )
参数介绍:
mapper,index,columns:可以任选其一使用,可以是将index和columns结合使用。index和column直接传入mapper或者字典的形式。
axis:int或str,与mapper配合使用。可以是轴名称(‘index’,‘columns’)或数字(0,1)。默认为’index’。
copy:boolean,默认为True,是否复制基础数据。
inplace:布尔值,默认为False,是否返回新的DataFrame。如果为True,则忽略复制值。

import numpy as np
import pandas as pd
from pandas import Series, DataFrame

df1 = DataFrame(np.arange(9).reshape(3, 3), index = ['bj', 'sh', 'gz'], columns=['a', 'b', 'c'])
print(df1)
'''
    a  b  c
bj  0  1  2
sh  3  4  5
gz  6  7  8
'''

# 修改 df1 的 index
print(df1.index) # 可以打印出print的值,同时也可以为其赋值
df1.index = Series(['beijing', 'shanghai', 'guangzhou'])
print(df1)
'''
           a  b  c
beijing    0  1  2
shanghai   3  4  5
guangzhou  6  7  8
'''

# 可以使用map方法进行映射,map的使用方法就和python中的map几乎一样
print(df1.index.map(str.upper)) # Index(['BEIJING', 'SHANGHAI', 'GUANGZHOU'], dtype='object')

print(df1) # 结果 并未改变, 上面只是返回一个 dataframe 而已
'''
           a  b  c
beijing    0  1  2
shanghai   3  4  5
guangzhou  6  7  8
'''

# 如果 需要 改变的话,可以如下: 另外赋值给一个变量
df1.index = df1.index.map(str.upper)
print(df1) # 这样 就 改变了
'''
           a  b  c
BEIJING    0  1  2
SHANGHAI   3  4  5
GUANGZHOU  6  7  8
'''

# 更快捷的 方法 使用 rename,可以分别为 index 和 column 来指定值
# 使用 map 的方式来赋值
df2 = df1.rename(index=str.lower, columns=str.upper) # 这种方法 照样是产生一个新的 dataframe
print(df2)
''' 可以很轻松的 修改 dataframe 的 index 和 columns
           A  B  C
beijing    0  1  2
shanghai   3  4  5
guangzhou  6  7  8
'''

# 同时,rename 还可以传入字典
df3 = df2.rename(index={'beijing':'bj'}, columns = {'A':'aa'}) # 为某个 index 单独修改名称
print(df3) #
'''
           aa  B  C
bj          0  1  2
shanghai    3  4  5
guangzhou   6  7  8
'''

# 自定义map函数
def test_map(x):
    return x+'_ABC'

print(df1.index.map(test_map))
# 输出 Index(['BEIJING_ABC', 'SHANGHAI_ABC', 'GUANGZHOU_ABC'], dtype='object')

print(df1.rename(index=test_map))
'''
               a  b  c
BEIJING_ABC    0  1  2
SHANGHAI_ABC   3  4  5
GUANGZHOU_ABC  6  7  8
'''
  • 70
    点赞
  • 243
    收藏
    觉得还不错? 一键收藏
  • 12
    评论
pandasdataframe的参数包括: 1. data:数据,可以是numpy数组、列表、字典、Series、另一个DataFrame等。 2. index:行标签,可以是列表、数组、Series或者是由它们组成的列表。 3. columns:列标签,可以是列表、数组、Series或者是由它们组成的列表。 4. dtype:数据类型,可以是numpy数据类型或者Python数据类型。 5. copy:是否复制数据,默认为False。 6. na_values:将指定的值视为缺失值。 7. keep_default_na:是否保留默认的缺失值列表。 8. na_filter:是否过滤缺失值,默认为True。 9. verbose:是否显示详细信息,默认为False。 10. parse_dates:是否将日期解析为datetime类型,默认为False。 11. infer_datetime_format:是否自动推断日期格式,默认为False。 12. dayfirst:是否将日期的日放在前面,默认为False。 13. compression:压缩格式,可以是gzip、bz2、zip、xz等。 14. engine:读取文件的引擎,可以是c、python等。 15. nrows:读取的行数。 16. skiprows:跳过的行数。 17. skipfooter:跳过的尾部行数。 18. header:指定列所在的行数,默认为。 19. index_col:指定索引列的列或列号。 20. usecols:需要读取的列或列号。 21. delimiter:分隔符,默认为逗号。 22. sep:分隔符,与delimiter参数作用相同。 23. decimal:小数点分隔符。 24. thousands:千位分隔符。 25. encoding:文件编码。 26. squeeze:是否将单列DataFrame转换为Series,默认为False。 27. memory_map:是否使用内存映射文件读取数据,默认为False。 28. float_precision:浮点数精度。
评论 12
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值