Pandas 数据处理

修改index、columns

1. 导入模块

import numpy as np 
import pandas as pd 

2. 修改index、columns, 通过把原来的数据覆盖掉进行修改

# 修改index、columns, 通过把原来的数据覆盖掉进行修改
df1 = pd.DataFrame(np.arange(9).reshape(3,3), index=['sh','cs','bj'],columns=['a','b','c'])
print(df1)
print("*"*20)
# 获取索引
print(df1.index)
print("*"*20)
# 获取索引数据['sh', 'cs', 'bj']
print(df1.index.tolist())
print("*"*20)
# 修改索引 
df1.index = ['shanghai','changsha','beijing']
print(df1)
print("*"*20)
# 修改列名
df1.columns = ['A','B','C']
print(df1)

运行结果

    a  b  c
sh  0  1  2
cs  3  4  5
bj  6  7  8
********************
Index(['sh', 'cs', 'bj'], dtype='object')
********************
['sh', 'cs', 'bj']
********************

                  a  b  c
shanghai   0  1  2
changsha  3  4  5
beijing       6  7  8
********************

                  A  B  C
shanghai   0  1  2
changsha  3  4  5
beijing       6  7  8

3. 批量进行重命名
# 批量进行重命名
def func(x):
    return x+'_ABC'

# rename 
df1.rename(index=func, columns=func)  # 注意:没有使用inplace=True时,不会修改df1的数据,而是返回一个新的数据

运行结果

4. 个性化更改行索引或者列索引 优先考虑字典的方式 

df2 = df1.rename(index={'shanghai':'SHANGHAI'}, columns={'C': 'c'})
print(df2)

运行结果

                     A  B  c
SHANGHAI  0  1  2
changsha     3  4  5
beijing          6  7  8

常见操作

添加列

data = {
    'Date':['2023-09-01','2023-09-02','2023-09-03'],
    'Step
  • 20
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值