Python数据分析:时间序列分析——实际操作(一)

1.我们在引入库的时候,还需要用import datetime as dt引入datetime库,因为后面的操作很多都和日期有关,很有可能会用到和datetime有关的函数。

2.date_range():可以指定开始时间与周期

  • H:小时
  • D:天
  • M:月

3.pd.date_range("Y-M-D",periods=t,freq="kD"):生成开始时间为Y-M-D,周期为k天的t个日期,D也可以换成其他表示时间的字母。
在这里插入图片描述

4.pd.Series(np.random.randn(n),index=pd.date_range(dt.datetime(Y,M,D),periods=t)):生成以时间为索引的n个随机数。在这里插入图片描述
除了可以进行索引,我们还可以对日期进行切片操作从而得到数据。在这里插入图片描述
5.truncate():过滤操作,参数可以为before=after=,过滤掉参数所指定的日期之前或之后的数据,不包括参数内指定的数据。在这里插入图片描述
6.pd.Timestamp():指定时间戳。

7.pd.Timedelta("n days"):指定时间偏移量。在这里插入图片描述
8.时间戳和时间区间还可以指定更多的细节。在这里插入图片描述
在这里插入图片描述
9.resample():数据重采样函数,可以后接一个函数求数据的统计量。在这里插入图片描述在这里插入图片描述
10.由于在升采样的过程中会出现空值,所以需要进行插值以填补空缺。

  • ffill(n):填充从前往后的n个空值,空值取前面的值。
  • bfill(n):填充从前往后的n个空值,空值取后面的值。
  • interpolate():线性取值。在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述

11.df.rolling(window = n):指定以n为周期的滑动窗口,所谓滑动窗口就是缩小数据所在的区间进而求得更为精确的统计量。在这里插入图片描述
12.可以根据均值绘制出一个较为平稳的时间序列图像。

import pandas as pd
import numpy as np
import datetime as dt
import matplotlib.pyplot as plt
import matplotlib as mpl
import seaborn as sns
df_time = pd.Series(np.random.randn(600),index=pd.date_range("2018-1-1",periods=600,freq="D"))
r = df_time.rolling(window=10)
mean_r = df_time.rolling(window=10).mean()
fig = plt.figure(figsize=(15,5))
df_time.plot(style="c-.")
mean_r.plot(style="r-")

在这里插入图片描述

  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值