输出
二、数据处理
定义预测列标签名 存放研究对象的标签名
forecast_col = ‘Adj. Close’;
定义预测天数 这里取所有数据量长度的百分之1
forecats_count = math.ceil(len(df)*0.01)
z只用到以下字段
df = df[[‘Adj. Open’,‘Adj. High’,‘Adj. Low’,‘Adj. Close’,‘Adj. Volume’]];
print(df);
构造两个新的列 HL_PCT为股票最高价与最低价变化百分比 PCT_Change为股票收盘价与开盘价的变化百分比
df[‘HL_PCT’] = (df[‘Adj. High’]-df[‘Adj. Low’])/df[‘Adj. Close’]*100;
df[‘PCT_Change’] = (df[‘Adj. Close’]-df[‘Adj. Open’])/df[‘Adj. Open’]*100;
真正用到的特征字段如下
df = df[[‘Adj. Close’,‘HL_PCT’,‘PCT_Change’,‘Adj. Volume’]];
print(df.head());