读取黄金 ETF 数据
本文使用机器学习方法来预测最重要的贵金属之一黄金的价格。我们将创建一个线性回归模型,该模型从过去的黄金 ETF (GLD) 价格中获取信息,并返回对第二天黄金 ETF 价格的预测。GLD是直接投资实物黄金的最大ETF。(扫描本文最下方二维码获取全部完整源码和Jupyter Notebook 文件打包下载。)
首先要做的是:导入所有必要库。
# LinearRegression 是一个用于线性回归的机器学习库
from sklearn.linear_model import LinearRegression
# pandas 和 numpy 用于数据操作
import pandas as pd
import numpy as np
# matplotlib 和 seaborn 用于绘制图形
import matplotlib.pyplot as plt
%matplotlib inline
plt.style.use('seaborn-darkgrid')
# yahoo Finance用于获取数据
import yfinance as yf
然后,我们读取过去 12 年的每日黄金 ETF 价格数据并将其存储在 Df 中。我们删除不相关的列并使用 dropna() 函数删除 NaN 值。然后,我们绘制黄金 ETF 收盘价。
Df = yf.download('GLD', '2008-01-01', '2020-6-22', auto_adjust=True)
DfDf = Df[['Close']]
DfDf = Df.dropna()
Df.Close.plot(figsize=(10, 7),color='r')
plt.ylabel("Gold ETF Prices")
plt.title("Gold ETF Price Series")
plt.show()
定义解释变量
解释变量是一个被操纵以确定第二天黄金 ETF 价格的变量。简单