pandas与excel联动-pandas基础6-str/cat/dt

有用的中间类型

.str

numpy支持多种数据类型,但字符串都是存储为object_类型的。str则是一个有用的中间类型。

>>> s = pd.Series(['a_b','b_c','c_d'],dtype = 'object')
>>> s
0    a_b
1    b_c
2    c_d
dtype: object
>>> s.str.split("_",expand=True) # 相当于分列了
   0  1
0  a  b
1  b  c
2  c  d
>>> s.str.split("_",expand=False)
0    [a, b]
1    [b, c]
2    [c, d]
dtype: object

.cat

处理类别。

>>> s = pd.Series( [1,2,3], dtype = 'category')
>>> s
0    1
1    2
2    3
dtype: category
Categories (3, int64): [1, 2, 3]
>>> s.cat.categories
Int64Index([1, 2, 3], dtype='int64')

.dt

处理时间格式。

>>> s = pd.Series(['2017-08-01','2017-08-03','2017-08-03'], dtype = 'datetime64[ns]')
>>> s
0   2017-08-01
1   2017-08-03
2   2017-08-03
dtype: datetime64[ns]
>>> s.dt.month
0    8
1    8
2    8
dtype: int64
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值