股价S&P预测——线性回归

本文使用线性回归预测S&P500指数,分析包含数据集介绍、数据清洗、预测值转换、误差测量、过拟合检测及未来改进方向。通过对股票市场数据的预处理,建立预测模型,并探讨不同误差评估指标。
摘要由CSDN通过智能技术生成

Dataset

*本文的数据集是美国股票市场指数sp500.csv,这个指数显示了市整个股票市场的情况,数据集包含了从2005年到2015年每天收盘指数值。S&P指标衡量了美国股票市场的整体情况,具体计算方法看这里。

date – the date of the price. In the format yyyy-mm-dd.
value – The price, in US dollars, of the S&P 500 at market close.

import pandas

sp500 = pandas.read_csv("sp500.csv")
print(sp500.head(10))
'''
         date    value
0  2005-06-27  1190.69
1  2005-06-28  1201.57
2  2005-06-29  1199.85
3  2005-06-30  1191.33
4  2005-07-01  1194.44
5  2005-07-04        .
6  2005-07-05  1204.99
7  2005-07-06  1194.94
8  2005-07-07  1197.87
9  2005-07-08  1211.86
'''

Cleaning The Invalid Rows

  • 观察到有一行的value缺失,这是由于股票市场放假,股市关闭没有交易,因此没有市场价格。
sp500 = sp500[sp500["value"] != "."]

Finding The Predictors

  • 一般对股票市场进行数据挖掘主要是想预测,那么预测明天的股市价格是个不错的主题,首先需要调整数据的格式,然后利用机器学习算法进行预测。我们期望的数据格式如下:
date value next_day
2005-06-27 1190.69 1201.57
2005-06-28 1201.57 1199.85
2005-06-29 1199.85 1191.33

下面创建了一个新的属性“next_

  • 1
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值