python修改dataframe的列名_pandas修改DataFrame列名的实例代码

pandas修改DataFrame列名的方法介绍

本篇文章给大家带来的内容是关于pandas修改DataFrame列名的方法介绍(代码示例),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。

本文参考自:pandas 修改 DataFrame 列名

原博客针对每个DataFrame.columns中的元素做相同的修改操作

而拙作是对每个元素做不同操作的生搬硬套, 请大家不吝赐教

提出问题

存在一个名为dataset的DataFrame

>>> dataset.columns

Index(['age', 'job', 'marital', 'education', 'default', 'housing', 'loan',

'contact', 'month', 'day_of_week', 'duration', 'campaign', 'pdays',

'previous', 'poutcome', 'emp.var.rate', 'cons.price.idx',

'cons.conf.idx', 'euribor3m', 'nr.employed', 'y'],

dtype='object')

现在, 我要将其columns名字改为:

>>> new_columns

Index(['age_0', 'job_1', 'marital_2', 'education_3', 'default_4', 'housing_5',

'loan_6', 'contact_7', 'month_8', 'day_of_week_9', 'duration_10',

'campaign_11', 'pdays_12', 'previous_13', 'poutcome_14',

'emp.var.rate_15', 'cons.price.idx_16', 'cons.conf.idx_17',

'euribor3m_18', 'nr.employed_19', 'y_20'],

dtype='object')

该如何操作?

解决

一.通过DataFrame.columns类的自身属性修改:

1.无脑赋值直接修改

>>> # 先解决`new_columns`的推导问题

>>> # 列表推导

>>> new_columns_list = [column_str+'_'+str(i) for i ,column_str in enumerate(dataset.columns)]

>>> # 类型转换

>>> new_columns = pd.core.indexes.base.Index(new_columns_list)

>>> dataset.columns = new_columns

2.通过.map(mapper, na_action=None)函数来修改

>>> # 注:mapper 多运用 lambda 表达式

>>> # 但我似乎没有找到在 lambda 表达式中改变两个值的方法

>>> # 所以只能蹩脚地用一个全局变量i, 和映射函数mapper()

>>> # 希望大家能帮我找到方法

>>> i = 0

>>> def mapper(x): # 映射函数即 mapper

global i

x += '_' + str(i)

i += 1

return x

>>> dataset.columns.map(mapper)

3.参考博客用到了DataFrame.columns.str对象

用help(DataFrame.columns.str)翻遍了文档,

也没能找到可以被我拿来套用的方法, 想着抽时间把这段文档翻译一下

二.通过DataFrame.rename()函数来修改

1.暴力字典法(好处:可以只修改特定的列)

>>> # 此处先用字典推导法

>>> new_dict = {

key:key+'_'+str(i)

for i, key in enumerate(dataset.columns)

}

>>> dataset.rename(columns=new_dict, inplace=True)

2.映射修改法

>>> # 原博文依然用到了 lambda 表达式

>>> # 我就再生搬硬套一次, 把上面的复制过来

>>> # 蹩脚地用一个全局变量i, 和映射函数mapper()

>>> i = 0

>>> def mapper(x): # 映射函数即 mapper

global i

x += '_' + str(i)

i += 1

return x

dataset.rename(columns=mapper, inplace=True)

稍微总结一下 : 字典推导和列表推导的使用方法很类似, 最大的区别是选择中括号还是大括号

Python pandas.DataFrame调整列顺序及修改index名的方法

1. 从字典创建DataFrame

>>> import pandas

>>> dict_a = {'user_id':['webbang','webbang','webbang'],'book_id':['3713327','4074636','26873486'],'rating':['4','4','4'],'mark_date':['2017-03-07','2017-03-07','2017-03-07']}

>>> df = pandas.DataFrame(dict_a) # 从字典创建DataFrame

>>> df # 创建好的df列名默认按首字母顺序排序,和字典中的先后顺序并不一样,字典中是'user_id','book_id','rating','mark_date'

book_id mark_date rating user_id

0 3713327 2017-03-07 4 webbang

1 4074636 2017-03-07 4 webbang

2 26873486 2017-03-07 4 webbang

2. 调整列顺序

>>> df = df[['user_id','book_id','rating','mark_date']] # 调整列顺序为'user_id','book_id','rating','mark_date'

>>> df

user_id book_id rating mark_date

0 webbang 3713327 4 2017-03-07

1 webbang 4074636 4 2017-03-07

2 webbang 26873486 4 2017-03-07

3. 调整index为从1开始

>>> df.index = range(1,len(df) + 1) # 将index改成从1开始

>>> df

user_id book_id rating mark_date

1 webbang 3713327 4 2017-03-07

2 webbang 4074636 4 2017-03-07

3 webbang 26873486 4 2017-03-07

DataFrame操作汇总:https://www.jb51.net/article/163645.htm

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持码农之家。

以上就是本次给大家分享的关于java的全部知识点内容总结,大家还可以在下方相关文章里找到相关文章进一步学习,感谢大家的阅读和支持。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值