时间序列----ARIMA 对苹果进行股价分析

action_mind

已于 2024-04-08 15:02:17 修改

阅读量1.5k

点赞数 34

分类专栏：数据分析-python 文章标签： python 开发语言

于 2024-04-06 21:50:20 首次发布

本文链接：https://blog.csdn.net/chengyulinhhhh/article/details/137439343

版权

import yfinance as yf
import pandas as pd
from statsmodels.tsa.arima.model import ARIMA
import matplotlib.pyplot as plt

# 加载数据
apple_stock = yf.download('AAPL', start='2023-01-01', end='2024-01-01')

# 确保数据按日期排序
# 假设apple_stock是你从yfinance下载的DataFrame
dates = pd.date_range(start='2023-01-01', end='2023-12-31', freq='D')  # 'D'代表每日频率
apple_stock.index = pd.DatetimeIndex(apple_stock.index).normalize()  # 规范化索引以去除时间，保留日期
apple_stock = apple_stock.reindex(dates, method='ffill')  # 重新索引以填充缺失的日期，并向前填充数据

# 现在apple_stock有了一个明确的频率，可以再次尝试ARIMA模型

# 使用收盘价
closing_prices = apple_stock['Close']

[*********************100%%**********************]  1 of 1 completed

"""
参数优化对于ARIMA模型的性能至关重要。
理想的参数（p, d, q）能够最准确地捕捉到时间序列数据的特性，从而提高预测的准确性。
一种自动化寻找最佳ARIMA模型参数的方法是使用pmdarima库中的auto_arima函数。
这个函数通过遍历不同的参数组合，选择出最佳的模型
"""
# 使用.ffill()和.bfill()方法替代fillna(method='ffill')和fillna(method='bfill')
closing_prices = closing_prices.ffill()  # 向前填充，填充缺失值
closing_prices = closing_prices.bfill()