基于《数据挖掘与R语言》一书中案例,
一、问题描述与目标
数据挖掘技术在股票市场交易具有巨大应用潜力,我们希望应用标准普尔500指数的历史数据来预测未来指数的变化。因此我们的模型将包含进一个交易系统中,该交易系统的应用模型的预测结果来生成决策。总体的评估标准就是该交易系统的性能,即该交易系统的交易所产生的利润或者损失,我们的主要评价指标是应用数据挖掘过程发现的知识来进行交易所产生的结果,而不是在该过程中所发现的模型的预测准确性。
二、数据说明
数据来源与《数据挖掘与R语言》一书的网站:http://www.dcc.fc.up.pt/~ltorgo/DataMiningWithR/datasets3.html
数据属性包括以下几个属性:
交易日期
当日开盘价
当日最高价
当日最低价
当日收盘价
当日成交量
当日调整后的收盘价
观察可知 本案例将涉及关于时间序列的相关方法。
三、从MYSQL数据库中获取数据
ch <- odbcConnect("mysql_data",uid="root",pwd="123456")
sqlTables(ch)
ch <- odbcConnect("mysql_data",uid="root",pwd="123456")
ch <- odbcConnect("mysql_data",uid