时间序列一些相关算法

最新推荐文章于 2024-07-24 20:39:13 发布

Gin_Tan

最新推荐文章于 2024-07-24 20:39:13 发布

阅读量1.2k

点赞数

分类专栏：时间序列文章标签：机器学习算法 python

本文链接：https://blog.csdn.net/czdsdhryes/article/details/107563045

版权

时间序列专栏收录该内容

2 篇文章 0 订阅

订阅专栏

时间序列算法

时间序列是按时间顺序索引的一系列数据点，主要有如下两种分析方法:

频域法:频谱分析和小波法
时域法:自相关和互相关法

或者

参数法
非参数法

1.移动平均法

1.1 简易移动平均法

有观察序列 ${x_i:i>= 1\}$ ，简易移动平均法(simple moving average, SMA)是对指定步长w的无权重取均值．若w步长内的值为 $x_i, x_{i-1}, ... , x_{i-(w-1)}$ ，有:

$M_i = {1 \over W} \sum_{j=0}^{W-1}x_{i-j} = {x_i + x_{i-1}+...+x_{i-(W -1)} \over W}$

若计算的是连续变化的值(新值进来，老值出去)，上面公式可以写为:

$M_i = M_{i-1}+ {X_i \over W } - {X_i-W \over W}$

1.2 移动平均法

有观察序列 ${x_i:i>= 1\}$ ，一种累积的移动平均法是无权重取均值．若w步长内的值为 $x_i, x_{i-1}, ... , x_{i-(w-1)}$ ，有:

$CMA_i = {x_1 + ...+ x_i \over i}$

若我们有新值 $x_{i+1}$ ，那么该累积的移动平均值为:

$\begin {aligned} CMA_{i+1} =& {x_1 +...+x_i+x_{i+1}\over {i+1}} \\ =& {x_ {i+1}+n*CMA_i \over {i+1}} \\ =&{CMA_i + {X_{i+1} - CMA_i} \over {i+1}} \end {aligned}$

1.3加权平均法

顾名思义带权重的方法[狗头]，假设权重关系满足 $\sum_{j=0}^{w-1} weight_j = 1$ , 并且 $weight_j \geq 0$ ，有:

$WMA_i = \sum_{j=0}^{w-1} weight_j*x_{i-j}$

特别地，如果让权重 ${weight_j : 0<=j< =w-1\}$ 满足 :

$weight_j = {w-j \over w+(w-1) +..+1} ,for:~ 0 <=j<=w-1$
此时
$WMA_i = {wx_i + (w-1)x_{i-1}+ ...+ 2x_{i-w+2}+ x_{i-w+1} \over w+(w-1)+...+1}$
简单的说就是近的权重大，远的权重小，权重分子为位置，分母为位置累加

假设:
$\begin {aligned} Total_i =& x_i +...+ x_{i-w+1} \\ Numerator_i =& wx_i +(w -1)x_{i-1}+...+x_{i-w+1} \end {aligned}$
那么对于有新值来说公式变形为:
$\begin {aligned} Total_{i+1} =& Total_i + x_{i+1}- x_{i-w+1} \\ Numerator_{i+1} =& Numerator_i + wx_{i+1} - Total_i \\ WMA_{i+1} =& {Numerator_{i+1} \over w+(w-1)+...+1} \end {aligned}$

2.指数平滑法

2.1 指数加权移动平均法

有观察数列 ${Y_t: t>=1\}$ ，指数加权移动平均数列 $\{S_t: t\ge1\}$ 定义为:

$S_t= \begin{cases} Y_1,& \text{t=1}\\ \alpha \cdot Y_{t-1}+(1-\alpha)*S_{t-1}& \text{t$\geq$ 2} \end{cases}$

$\alpha \epsilon [0 ,1]$ 是恒定平滑因子
$Y_t$ 为在时刻t观察到的值
$S_t$ 是EWMA在任意t时刻的值

从上面的定义有:
$S_t = \alpha [Y_{t-1}+ ( 1-\alpha)Y_{t-2}+...+ (1-\alpha)^kY_{t-(k+1)}] + (1-\alpha)^{k+1}S_{t-(k+1)}$
对于任意合适的k $\epsilon$ {0, 1,2,…}，权重 $Y_{t-i}$ 为 $\alpha( 1-\alpha)^{i-i}$

假设有观察数列 ${Y_t: t>=1\}$ ，交替指数加权移动平均序列 $\{S_t: t\ge1\}$ 被定义为:
$S_{t,alternate}= \begin{cases} Y_1,& \text{t=1}\\ \alpha \cdot Y_{t}+(1-\alpha)*S_{t-1,alternate,}& \text{t$\geq$ 2} \end{cases}$
这里，我们使用 $Y_t$ 替代 $Y_{ t-1}$

2.2双指数平滑

Suppose $\{Y_t:t \ge1\}$ is an observed data sequence, there are two equations associated with double exponential smoothing:

$S_t = \alpha Y_t + (1-\alpha)(S_{t-1}+ b_{t-1})$

$b_t = \beta (S_t - S_{t-1}) + (1-\beta)b_{t-1})$

where $\alpha \epsilon [0,1]$ is the data smoothing factor and $\beta \epsilon [0,1]$ is the trend smoothing factor

Here, the initial values are $S_1 = Y_1$ and $b_1$ has three possibilities:

$b_1 = Y_2 - Y_1$

$b_1 = {(Y_2 - Y_1) + (Y_3 - Y_2)+ (Y_4 - Y_3) \over 3} = {Y_4 - Y1 \over 3}$

$b_1 = {Y_n-Y_1 \over n-1}$

不想改了自己看吧[这些公式编辑起来是真的麻烦]

-------------20200724要准备下班了，不写了，下次继续

-------------我去一晃七月就要过去了，又特么摸了一周的鱼，平安平安

-------------20200814哦草一晃就来到了八月中旬，这里补一个常见的一次二次三次指数平滑。其实指数平滑可以拿来做信号平滑也可以拿来做预测，当然做预测有更好的工具就是了。

# 平滑指数
def calc_next_s(alpha, x):
    s = [0 for  i in range(len(x))]
    s[0] = np.sum(x[0:3]) / float(3)
    for i in range(1, len(s)):
        s[i] = alpha*x[i] + (1-alpha)*s[i-1]
    return s

# 基于平滑指数预测
def time_predict(alpha, x):
    
    s1 = calc_next_s(alpha, x)# 一次
    s2 = calc_next_s(alpha,s1)# 二次
    s3 = calc_next_s(alpha, s2)# 三次
    a3 = [(3 * s1[i] - 3 * s2[i] + s3[i]) for i in range(len(s3))]
    b3 = [((alpha / (2 * (1 - alpha) ** 2)) * ((6 - 5 * alpha) * s1[i] - 2 * (5 - 4 * alpha) * s2[i] + (4 - 3 * alpha) * s3[i])) for i in range(len(s3))]
    c3 = [(alpha ** 2 / (2 * (1 - alpha) ** 2) * (s1[i] - 2 * s2[i] + s3[i])) for i in range(len(s3))]
    pred = a3[-1]+b3[-1]*1+c3[-1]*(1**2)
    print(pred))

在这里插入图片描述
上图移动平均和指数平滑效果的对比，移动平均的步长是5，指数平滑的 $\alpha$ 是0.1，个人感觉指数平滑去毛刺效果更好。

这里抄一个关于指数平滑 $\alpha$ 的判断方法:
经验判断
1、当时间序列呈现较稳定的水平趋势时，应选较小的α，一般可在0.05~0.20之间取值‘
2、当时间序列有波动，但长期趋势变化不大时，可选稍大的α值，常在0.1~0.4之间取值；
3、当时间序列波动很大，长期趋势变化幅度较大，呈现明显且迅速的上升或下降趋势时，宜选择较大的α值，如可在0.6~0.8间选值。以使预测模型灵敏度高些，能迅速跟上数据的变化。
4、当时间序列数据是上升（或下降）的发展趋势类型，α应取较大的值，在0.6~1之间。
--------------------------------------------20200814 今天一定要多写一点。

3.控制图理论

控制图，用图形化来量化样本特征

中心线(CL, Center Line)：质量特征的均值
上控制限(UCL, Upper Control Limit)和下控制限(LCL, Lower Control Limit):两条水平线

3.1 3 $\sigma$ 控制图

假设w是一个特征序列，w的均值为 $\mu_w$ ，标准差为 $\sigma_w$ ．那么有:
UCL = $\mu_w$ + L $\sigma_w$
CL = $\mu_w$
LCL = $\mu_w$ - L $\sigma_w$

这里L是相对中心线的控制距离，用标准差为单位，比如说L=3，那么它就是3 $\sigma$ 控制图

3.2 累计和控制图

假设 $x_i$ 是序列{ $x_i:1\leq i\leq n$ }的第i个值，该序列满足正态分布，均值为 $\mu$ ，标准差为 $\sigma$ ，累计和控制图(CUSUM, cumulative sum control chart )计算方法为:
$C_i= \sum_{j=1}^i (x_j - \mu_0)= C_{i-1} + (x_i- \mu_0)$
这里 $C_0=0$ ， $\mu_0$ 是目标过程的平均值．

若 $C_i|$ 超出决策间隔H，那么该过程就被认为失去控制．
决策间隔H为3 $\sigma$ 或者5 $\sigma$

不同点

3 $\sigma$ 控制:超出3 $\sigma$ 控制限值的一个或多个点
CUSUM控制:当小位移很重要时，这是一个很好的选择

3.3 表或者算法形式的CUSUM

$x_i$ 满足观察序列{ $x_i : 1 \leq i \leq n$ }，序列均值为 $\mu_0$ ，标准差为 $\sigma$ ．统计学 $C^+$ 和 $C^-$ 计算公式如下:
$C_i^+ = max[0, x_i - (\mu_0 + K) + C_{i-1}^+] \\ C_i^- = max[0,(\mu_0 - K) - x_i + C_{i-1}^- ]$
$C_0^+ = C_0^- = 0$ ．K为参考值，计算公式为 $K={|\mu_1 - \mu_0| \over 2}$ ， $\mu_1 = \mu_0 + \delta\sigma$ ，并且 $\delta=1$

3.4 指数平滑控制图

指数平滑(指数加权移动平均expoentially weighted moving average )定义如下:
$z_i = \lambda x_i + (1 - \lambda )z_{i-1}$

Gin_Tan

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
时间序列一些相关算法

时间序列算法滤波平滑时间序列是按时间顺序索引的一系列数据点，主要有如下两种分析方法:频域法:频谱分析和小波法时域法:自相关和互相关法或者参数法非参数法1.移动平均法1.1 简易移动平均法有观察序列 {xi:i>=1}\{x_i:i>= 1\}{xi:i>=1} ，简易移动平均法(simple moving average, SMA)是对指定步长w的无权重取均值．若w步长内的值为 xi,xi−1,...,xi−(w−1)x_i, x_{i-1}, ... , x
复制链接

扫一扫