python支持向量机 股票,python用线性回归预测股票价格

最小二乘法

1、什么是最小二乘思想?

简单地说,最小二乘的思想就是要使得观测点和估计点的距离的平方和达到最小.这里的“二乘”指的是用平方来度量观测点与估计点的远近(在古汉语中“平方”称为“二乘”),“最小”指的是参数的估计值要保证各个观测点与估计点的距离的平方和达到最小。从这个上也可以看出,最小二乘也可用于拟合数据模型。

2. 最小二乘法推导

我们以最简单的一元线性模型来解释最小二乘法。什么是一元线性模型呢? 监督学习中,如果预测的变量是离散的,我们称其为分类(如决策树,支持向量机等),如果预测的变量是连续的,我们称其为回归。回归分析中,如果只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。对于二维空间线性是一条直线;对于三维空间线性是一个平面,对于多维空间线性是一个超平面…

对于一元线性回归模型, 假设从总体中获取了 nn 组观察值 (X1,Y1)(

X

1

Y

1

),(X2,Y2)(

X

2

Y

2

),…,(Xn,Yn)(

X

n

Y

n

)。对于平面中的这 nn 个点,可以使用无数条曲线来拟合。要求样本回归函数尽可能好地拟合这组值。综合起来看,这条直线处于样本数据的中心位置最合理。 选择最佳拟合曲线的标准可以确定为:使总的拟合误差(即总残差)达到最小。有以下三个标准可以选择:

(1)用“残差和最小”确定直线位置是一个途径。但很快发现计算“残差和”存在相互抵消的问题。

(2)用“残差绝对值和最小”确定直线位置也是一个途径。但绝对值的计算比较麻烦。

(3)最小二乘法的原则是以“残差平方和最小”确定直线位置。用最小二乘法除了计算比较方便外,得到的估计量还具有优良特性。这种方法对异常值非常敏感。

最常用的是普通最小二乘法( Ordinary Least Square,OLS):所选择的回归模型应该使所有观察值的残差平方和达到最小。

公式推导

1 拟合直线:y=a+bxy

=

a

+

b

x

2 有任意观察点 (xi,yi)(

x

i

,

y

i

)

3 误差为 di=yi−(a+bxi)d

i

=

y

i

(

a

+

b

x

i

)

4 当 D=∑ni=1d2i=0D

=

i

=

1

n

d

i

2

=

0 取值最小时,直线拟合度最高。

5 D=∑ni=1d2i=∑ni=1(yi−a−bxi)2D

=

i

=

1

n

d

i

2

=

i

=

1

n

(

y

i

a

b

x

i

)

2, 对 a,ba

,

b 分别求一阶偏导:

∂D∂a=∑i=1n2(yi−a−bxi)∗(−1)∂

D

a

=

i

=

1

n

2

(

y

i

a

b

x

i

)

(

1

)

∂D∂b=2∑i=1n(yi−a−bxi)(−xi)=−2(∑i=1nxiyi−a∑i=1nxi−b∑i=1nx2i)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值