python如何优雅的将pandas的df类目由驼峰式改为下滑线式

7 篇文章 0 订阅
5 篇文章 0 订阅

本文用到的数据,可以加QQ跟群主获取:
群名称:PYTHONERS-数据
群 号:663468799
学习python和数据分析推荐地方: www.lynda.com
获取lynda官网会员的方式:get_lynda_com()


如何优雅的将驼峰式改为下划线式命名。

总所周知,当时用pandas 的df.read_csv()方法后,读取的dataframe列名很多时候有可能是使用驼峰式命名的,而python的使用习惯是下划线式命名, 那么如何通过一个函数简单优雅的将df.columns转化为小写的下划线式命名呢?
以下是代码,直接拷贝使用

import re 
def clean_columns(name):
    name = name.strip()
    s1 = re.sub('(.)([A-Z][a-z]+)', r'\1_\2', name)
    return re.sub('([a-z0-9])([A-Z])', r'\1_\2', s1).lower()
df.columns = [clean_columns(name) for name in df.columns]

拿走不谢。喜欢学习数据分析和pandas的同学可以看看 dataquest, 直达电梯: dataquest.io

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值