1.数据获取
使用TuShare获取数据(需要在tushare网站申请账号,获取token号)
取1-4月数据作为训练集,5月数据作为测试集(测试集数据提取代码同训练集)
ts.set_token('208cf0f7e03acf9024568071ab959d8cf3d1908385a7009906dc66d5')
pro = ts.pro_api()
time_temp = datetime.datetime.now() - datetime.timedelta(days=1)
end_dt = time_temp.strftime('%Y%m%d')
#准备训练集数据
df = ts.pro_bar(ts_code='603912.SH', start_date='20210101', end_date='20210501', freq='D')
df.head() #用 df.head() 可以查看一下下载下来的股票价格数据,显示数据如下:
#把数据按时间调转顺序,最新的放后面
df = df.iloc[::-1]
df.reset_index(inplace=True)
# print(df)
training_set = df.loc[:, ['close']]
#只取价格数据,不要表头等内容
training_set = training_set.values
#数据归一化
sc = MinMaxScaler(feature_range = (0, 1))
training_set_scaled = sc.fit_transform(training_set)
# print(training_set_scaled)