pandas 转换为文本类型_4-Pandas数据预处理之数据转换(文本数据规整)

Pandas对于字符串和文本处理通常是由一些内置的字符串方法指定,一般语法格式为:series.str.method。其中,str.method被称为矢量化的字符串方法,包括str.upper()、str.lower()、str.split()等一系列字符串的内置方法,还可以结合正则化式进行处理。

(1)矢量化的字符串方法将对Series或者Index中的每个元素都进行相同的处理;

说明:缺失值不做任何处理

>>> s = pd.Series(['ADJruK','hjuQ',np.nan,'hj'])

>>> s

0 ADJruK

1 hjuQ

2 NaN

3 hj

dtype: object

>>> s.str.upper()

0 ADJRUK

1 HJUQ

2 NaN

3 HJ

dtype: object

(2)对于Index对象也可以使用矢量化字符串的处理方式;

>>> df = pd.DataFrame(np.random.randint(10,size=(2,3)),columns=['Jack Joe','BOB Marly','sid Jane'])

>>> df

Jack Joe BOB Marly sid Jane

0 4 1 4

1 9 1 8

#将所有列名转化为小写

>>> df.columns = df.column

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值