3.5 基于线性回归的股票预测
1.数据获取
我们需要的数据集要通过quandl包获取,Anaconda 3并未默认安装quandl,
需要我们打开Anaconda prompt输入“pip install quandl”进行安装。
通过quandl包可以获取到股票数据
股票特征数据包括:
Open(开盘价)、High(最高价)、Low(最低价)、Close(收盘价)、Volume(交易额)
Adj. Open(调整后开盘价)、Adj. Low(调整后最低价)、Adj. Close(调整后收盘价)、Adj. Volume(调整后交易额)等数据。
import quandl
# 我们需要的数据集要通过quandl包获取
# 安装新的包,需要打开anaconda prompt输入“pip install quandl”进行安装
# Anaconda3中添加quandl库的方法:
#(1)开始——Anaconda——打开Anaconda Prompt
#(2)输入pip install quandl(自动安装)
#(3)输入conda list,检查有无quandl,有则成功
# 关于quandl包可以参考https://zhuanlan.zhihu.com/p/41063833
# 通过prompt安装其他包也是同理
from sklearn import preprocessing
#df = quandl.get('WIKI/GOOGL') #先注释这一行,预测Google股票时再启用
df = quandl.get('WIKI/AAPL')
print(df)
# 输出结果如下:
Open High Low ... Adj. Low Adj. Close Adj. Volume
Date ...
1980-12-12 28.75 28.87 28.75 ... 0.422706 0.422706 117258400.0
1980-12-15 27.38 27.38 27.25 ... 0.400652 0.400652 43971200.0
1980-12-16 25.37 25.37 25.25 ... 0.371246 0.371246 26432000.0
1980-12-17 25.87 26.00 25.87 ... 0.380362 0.380362 21610400.0
1980-12-18 26.63 26.75 26.63 ... 0.391536 0.391536 18362400.0
...