Python预测股票走势

Python的功能可谓相当强大,在很多行业具有相当的优势,这种优势很大程度上来源于各种第三方库。本文介绍了如何利用时间序列模型ARIMA进行股票走势预测。

环境:windows 64

平台:Jupyter Notebook (Kernel python3)

库:tushare  statsmodels pandas numpy  seaborn matplotlib

先来看看效果吧

                                   

图1 预测结果图

图1中橙色线条为股票行情实际数据,蓝色线条为模型预测的行情走势,预测结果显示股票呈上涨趋势,从长期来看,还是符合实际走势的,证明了ARIMA模型具有一定的可信性。但是在这里还是要提醒大家一句,股市有风险,投资需谨慎。模型只能提供一个参考,并不能完全正确的指导用户投资。

股票行情数据获取

数据的获取利用第三方库tushare,tushare是一个免费、开源的python财经数据接口包, 具体的介绍点我。

tushare的安装方法很简单, pip install tushare即可。

 

 
  1. import tushare

  2. data=tushare.get_h_data('600000',start='2005-05-05')

  3. data.to_csv('600000_2005.csv')

导入库,然后调用get_h_data函数获取数据,‘600000’指定股票代码,start指定数据开始的日期,最后将获取的数据使用to_csv函数以csv格式保存到本地。

注意:调用get_h_data时有时会出现错误,可能是由于服务器不稳定,重新执行即可。但两次调用之间要间隔一定时间。

 

数据读取与预处理

 
  1. df=pd.read_csv('600000_2005.csv',index_col=0,parse_dates=[0])

  2. #index_col表示把第一列设为index,parse_dates=[0]表示把第一列按datetime格式解析

使用pandas的read_csv函数进行读取数据,各指标意义见代码段中的注释。

             

图2 读取数据展示

pandas读取出的数据如图2所示,我们将选取close,即收盘价作为考核指标来建立ARIMA模型。

 

ARIMA模型建立

 

 
  1. stock_week=df['close'].resample('W-TUE').mean()

  2. #将收盘价作为评判标准,resample指按周统计平均数据(可以指定哪天为基准日,此处是周二为基准)

  3. stock_train=stock_week['2005':'2017'].dropna()

  4. #选取2005-2017的数据

原始数据是股票每天的行情,我们这里将数据进行重采样,按每周的平均行情来进行分析,‘W-TUE’表示按周为单位,指定周二为基准日,即周二到下个周二为一个计算周期。

 

画图看一下现在的数据

 

    

图3 重采样后的数据

 

图3使用matplotlib和seaborn绘制,代码如下

 
  1. stock_train.plot(figsize=(12,8))

  2. # plt.legend(bbox_to_anchor=(1.25,0.5))

  3. plt.title('Close Price')

  4. sns.despine() #边框控制,默认没有上方和右方的框

  5. plt.show()


由图3可以看出,数据波动比较大,而时间序列模型要求数据平缓,满足平稳性的要求。因此需要对数据进行差分处理。

 

 
  1. stock_diff=stock_train.diff().dropna() #对数据进行差分,目的使数据平缓,满足平稳性的要求

  2. plt.figure()

  3. plt.plot(stock_diff)

  4. font_loc=''

  5. plt.title('一阶差分',fontproperties=font_set) #注意要设置字体,否则会乱码

  6. plt.show()


                                  

图4 一阶差分结果图

 

一阶差分的结果如图4所示,图4可以看出数据基本已经趋于平缓,为了确定一阶差分足以满足需求,再进行ACF和PACF检验,ACF和PACF可以直接调用statemodel里的函数进行求算。

 

 
  1. from statsmodels.graphics.tsaplots import plot_acf,plot_pacf

  2. acf=plot_acf(stock_diff,lags=20)

  3. plt.title('ACF')

  4. acf.show()

  5. plt.show()

  6. pacf=plot_pacf(stock_diff,lags=20)

  7. plt.title('PACF')

  8. pacf.show()

  9. plt.show()


                                    

图5 ACF结果图

 

                                     

                                                                          图6 PACF结果图

由图5和图6可以看出,进行一阶差分时,结果已经落在了置信区间内(图中蓝色区域),因此可以确定进行一阶差分是可靠有效的。

 

接下来就可以进行ARIMA模型训练了

 
  1. model=ARIMA(stock_train,order=(1,1,1),freq='W-TUE')#训练模型,order表示(p,d,q)

  2. model=sm.tsa.statespace.SARIMAX(stock_train,order=(1,1,1) , seasonal_order=(1, 1, 1, 12),
                                    enforce_stationarity=False,
                                    enforce_invertibility=False)#训练模型,order表示(p,d,q)

  3. result=model.fit()

参数order=(1,1,1)表示一阶差分,ACF和PACF的取值均为1,关于差分阶数、ACF、PACF取值详细介绍点我

 

最后一步就是利用建立好的result模型来预测走势了

 

pred=result.predict('20160816','20180112',dynamic=True,typ='levels')#注意预测的起始时间要在训练时间的范围内,结束时间没有要求

需要注意的是,预测数据起始时间必须在训练集内,而终止时间则没有限制

 

 
  1. plt.figure(figsize=(6,6))

  2. plt.xticks(rotation=45)

  3. plt.plot(pred)

  4. plt.plot(stock_train)

  5. plt.show()


画图

就可以看见文章开头的结果了

 

                                   

线性回归是一种常见的机器学习算法,可以用于预测股票走势。具体而言,我们可以将股票价格看作因变量Y,时间看作自变量X,然后通过线性回归模型来拟合这些数据,从而预测未来的股票价格。 以下是一个简单的Python代码示例,演示如何使用线性回归来预测股票走势: ``` python import pandas as pd from sklearn.linear_model import LinearRegression # 加载数据 df = pd.read_csv('stock_data.csv') # 准备数据(将时间转换为数字) df['date'] = pd.to_datetime(df['date']) df['date'] = df['date'].astype('int64') X = df[['date']] Y = df['price'] # 创建线性回归模型并拟合数据 model = LinearRegression() model.fit(X, Y) # 预测未来的股票价格 future_dates = pd.date_range(start='2021-01-01', end='2021-12-31') future_dates = future_dates.astype('int64') future_prices = model.predict(pd.DataFrame({'date': future_dates})) # 输出预测结果 print(future_prices) ``` 在这个示例中,我们使用Pandas库加载了一个包含股票价格的CSV文件。然后,我们将日期转换为数字,使用scikit-learn库中的LinearRegression类来创建线性回归模型,并使用拟合的模型来预测未来的股票价格。最后,我们打印出预测结果。 需要注意的是,股票价格的预测是一件非常复杂的事情,线性回归模型可能无法完全准确地预测未来的股票价格。因此,在实际应用中,我们需要使用更复杂的模型和更多的数据来提高预测的准确性。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值