Pandas-------矢量化字符串与时间

1.矢量化字符串
对字符串的一些操作
变小写,求长度等
在这里插入图片描述

当然也支持索引和切片
在这里插入图片描述

一.时间

在Python中有对时间的描述,datatime模块,这里使用的是 pytz
1.时间的物理量
(1)地区时间的转换
在这里插入图片描述
当然对于时间,也是可以“ 计算的 ”
在这里插入图片描述
值得注意的是,在计算时需要通过参数指定地区信息
结果是时间间隔
(2)时间单位的转化
在这里插入图片描述

2.比较相关的模块
看一个有趣的事情
在这里插入图片描述
那么,当numpy和pandas遇到时间会怎样呢
在这里插入图片描述
显然,Pandas是在索引上操作,并且可以指定单位
再看Numpy
在这里插入图片描述
默认时间单位是‘天’,它是在数值上操作的
注意:给的单位是什么,输出结果就是什么,看下面例子
在这里插入图片描述

3.时间索引

     ‘时刻’,在Pandas中用Timestamp对象表征。用Timestamp对象可以构建 DatetimeIndex索引对象
     ‘时间间隔’,在Pandas中用 Timedelta对象表征。用Timedelta对象可以构建 TimedeltaIndex索引对象
     ‘周期’,在Pandas中用 Period对象表征。用 Period对象可以构建 PeriodIndex索引对象,并且此对象也能通过 DatetimeIndex
     对象的 Period()方法得到

一个周期转换的例子
在这里插入图片描述
另外还有三个函数

     pd.date_range()           pd.period_range()           pd.timedelta_range()
     这三个函数用法类似,这里重点介绍第一个

     pd.date_range(start=None, end=None,  periods=None,  freq='D' ......)

意为 ‘排序’
在这里插入图片描述
由图可知,‘freq’参数是设置周期,而 ‘periods’参数是设置对象中 ‘时刻’的数量
几个特殊例子如下
在这里插入图片描述
第一个设置周期为三小时三十分钟
第二个设置周期为 ‘只计算工作日’

4.重采样
“采样” 的意思是从大量对象中抽取一部分样品,我们要学习的是

                   resample()

它的作用在于变更索引的频率
在这里插入图片描述
设置索引
在这里插入图片描述
在这里插入图片描述
将原来周期 ‘D’变更为 ‘M’
因为原索引,有十一月和十月,所以变更后也是
“ kind” 参数指定变更后输出单位是 ‘月’

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值