跌跌撞撞搞了半天ARIMA模型，结果是越深入越懵懂，开始以为很难，学完以为很简单，再学特么的一个字“玄“呼

最新推荐文章于 2024-08-15 01:55:01 发布

茄子西瓜搬来的救兵

最新推荐文章于 2024-08-15 01:55:01 发布

阅读量297

点赞数

文章标签： python 线性回归算法时序数据库

本文链接：https://blog.csdn.net/m0_54985816/article/details/131013007

版权

本文作者分享了学习ARIMA模型的经历，从错误的方向开始，在PyCharm上进行数据分析，意识到应该使用Jupyter Notebook。通过参考书籍、网络资料和视频教程，发现选择合适的p和q参数并不简单，需要反复调整和检验。作者提供了带有注释的代码，并预告了对近期数据的预测。在进行差分操作时，作者观察到高阶差分的奇异现象，期待进一步探讨。

摘要由CSDN通过智能技术生成

学习的过程也是敲代码的过程，方向搞错了，搞数据分析，还得是notebook靠谱，我是上手直接在pycharm上撸的，越搞越发现得回头重新检测，重新调参，悔不当初。。。（不过好的一点是可以更加直观，及更加清晰的把思路捋出来）

学习参考一些书籍，结合网上各种乱七八糟的资料，B站各种七上八下的视频（绝大部分都是转的一个“奶声”博主的视频，但也发现里面很多有错误的地方，讲的不明不白和漏了的地方，博主可能也没完全整明白）。

ARIMA看似就简单pdq,主要是pq，d是属于比较简单的，pq的选择有很多的方法（AIC、BIC、遍历），选出来最优结果不一定适合你的模型，因为模型建好后还要对其进行评判，包括白噪声检测，残差检验。。。。不合格就得又回去找pq了。

下面直接上代码，过程还是比较清晰的（有需要的地方基本都有注释，有些阶段是需要反复使用的），欢迎课下交流！！！！

import math

import pandas as pd
import matplotlib.pyplot as plt
from statsmodels.tsa import stattools
from statsmodels.graphics.tsaplots import *
from statsmodels.tsa.stattools import adfuller              #平稳性ADF检测函数
from statsmodels.tsa.arima.model import ARIMA
import warnings                                             #忽略警告，设置周期的话影响模型
warnings.filterwarnings("ignore", message="A date index has been provided, but it has no associated frequency information and so will be ignored when e.g. forecasting.")

# 1.数据读取
df = pd.read_csv('D:\\history_A_000001_k_2010-01-01_2023-06-01_data.csv', index_col='date')

# 2.查看数据基本情况
def base(df):
    print(df.head())
    print(df.tail())
    print(df.info())
    print(df.describe())
    print(df.columns)
    print(df.index)
# base(df)
df.index = pd.to_datetime(df.index)  # 将索引type='object转化为datetime格式dtype='datetime64[ns]'


# 3.数据筛选
""""

最低0.47元/天解锁文章

茄子西瓜搬来的救兵

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
跌跌撞撞搞了半天ARIMA模型，结果是越深入越懵懂，开始以为很难，学完以为很简单，再学特么的一个字“玄“呼

ARIMA看似就简单pdq,主要是pq，d是属于比较简单的，pq的选择有很多的方法（AIC、BIC、遍历），选出来最优结果不一定适合你的模型，因为模型建好后还要对其进行评判，包括白噪声检测，残差检验......不合格就得又回去找pq了。
复制链接

扫一扫