时间序列

时间序列

1.生成一段时间范围
pd.date_range(start=None, end=None, periods=None, freq=‘D’)
输入start与end以及freq 生成start到end,频率为freq的时间

也可使用period生成时间段

import pandas as pd
pd.date_range(start='20200101',end='20201031',freq='M')
pd.date_range(start='20200101',period=10)

2.使用美国911报警数据各个时间段的数据可视化

①读取数据,将字符串转化为时间序列并设置为index

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

df=pd.read_csv('911.csv',sep=',')
import datetime
df['timeStamp']=pd.to_datetime(df['timeStamp']) #将字符串转化为时间序列
df.set_index('timeStamp',inplace=True) #设置为index
#拆分报案原因,并作dummy处理
df['kind']=df['title'].map(lambda x:x.split(':')[0])
df=pd.concat([df,pd.get_dummies(df['kind'])],axis=1)
df.head(2)

2.统计出911数据中不同月份电话次数的变化情况

#首先对时间序列进行重采样处理
count_month=df.resample('M').count()['kind']
_x=count_month.index
_x=[i.strftime('%Y%m%d') for i in _x]   #strftime  简化时间格式
_y=count_month.values
plt.figure(figsize=(16,10))
plt.plot(range(len(_x)),_y)

plt.xticks(range(len(_x)),_x,rotation=45) #设置x轴的刻度

3.统计出911数据中不同月份不同类型的电话的次数的变化情况

#不同类型
df1=df.loc[df['EMS']==1]
df2=df.loc[df['Fire']==1]
df3=df.loc[df['Traffic']==1]
#生成每月的数据
count_month_ems=df1.resample('M').count()['EMS']
count_month_fire=df2.resample('M').count()['Fire']
count_month_tra=df3.resample('M').count()['Traffic']
#去掉时间中的时分秒
_x1=count_month_ems.index
_x1=[i.strftime('%Y%m%d') for i in _x1]
_y1=count_month_ems.values

_x2=count_month_fire.index
_x2=[i.strftime('%Y%m%d') for i in _x2]
_y2=count_month_fire

_x3=count_month_tra.index
_x3=[i.strftime('%Y%m%d') for i in _x3]
_y3=count_month_tra.values
#绘制三种不同类型的折线图
plt.figure(figsize=(10,6))
plt.plot(range(len(_x1)),_y1,color='g',label='EMS')
plt.plot(range(len(_x2)),_y2,color='r',label='Fire')
plt.plot(range(len(_x3)),_y3,color='b',label='Traffic')
plt.legend()
plt.xticks(range(0,len(_x1),3),_x1,rotation=45)

#最後の一言
时间序列用于将多个时间段的数据变化情况呈现出来,日常应用广泛,如股票变化情况等。时间序列模型的应用场景也比较丰富。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
SARIMA(Seasonal Autoregressive Integrated Moving Average)是一种用于时间序列分析和预测的统计模型。它是ARIMA模型的扩展,专门用于处理具有季节性变化的时间序列数据。 SARIMA模型由四个部分组成:季节性自回归(SAR)、季节性差分(I)、季节性移动平均(SMA)和非季节性移动平均(MA)。下面是对每个部分的简要介绍: 1. 季节性自回归(SAR):SAR部分是指在模型中考虑了时间序列在过去时刻的季节性自相关关系。它表示当前时刻的值与过去时刻的值之间的关系。 2. 季节性差分(I):I部分是指对时间序列进行季节性差分,以消除季节性变化。差分操作可以将非平稳的时间序列转化为平稳的时间序列。 3. 季节性移动平均(SMA):SMA部分是指在模型中考虑了时间序列在过去时刻的季节性移动平均关系。它表示当前时刻的值与过去时刻的移动平均值之间的关系。 4. 非季节性移动平均(MA):MA部分是指在模型中考虑了时间序列在过去时刻的非季节性移动平均关系。它表示当前时刻的值与过去时刻的移动平均值之间的关系。 SARIMA模型的参数包括季节性自回归阶数(p)、季节性差分阶数(d)、季节性移动平均阶数(q)、非季节性移动平均阶数(P)、非季节性差分阶数(D)和非季节性移动平均阶数(Q)。通过对时间序列数据进行模型拟合和参数估计,可以使用SARIMA模型进行时间序列的预测和分析。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值