在此感谢 吴喜之 老师的耐心讲述,此系列博客记录 统计学 的学习历程。
概述
回归和分类:均为有指导学习,有一个抽象的函数模式。
y = f(X,Θ,ϵ)
f 是函数或算法模型。
y 是因变量, X 是自变量, Θ 是参数 (或模型选项), ϵ 是误差.。
[注]
当 y 为 数量变量 时为 回归;
当 y 为 分类 (定性) 变量 时为 分类 ;
可加误差形式 y=f(x,Θ)+ϵ y = f ( x , Θ ) + ϵ ;
线性形式 y=β0+∑pi=1βixi+ϵ y = β 0 + ∑ i = 1 p β i x i + ϵ ;
模型形式
线性模型.
x 为 1
个数量变量 的情况. 一般的模型形式为 y=β0+β1x+ε y = β 0 + β 1 x + ε
假定 x 是一个非随机的数目, ϵ 是模型所无法描述的随机误差项。
假定其均值 E(ϵ) = 0。 因此 y 是一个随机变量, 其均值
μ=E(y)=β0+β1+E(ϵ)=β0+β1x μ = E ( y ) = β 0 + β 1 + E ( ϵ ) = β 0 + β 1 x
这显然是平面上的一条截距为 β0
, 斜率为 β1
的直线。
如果有 p
个数量自变量 x1,x2,...,xp
, 则线性模型的一般形式可以写成
y=β0+β1x1+β2x2+⋯+βpxp+ϵ y = β 0 + β 1 x 1 + β 2 x 2 + ⋯ + β p x p + ϵ
如果数据有 n
个观测值, 为 (y1,x11,...,x1p),(y2,x21,...,x2p),...,(yn,xn1,...,xnp)
, 那么, 对于这个数据的线性模型为
yi=β0+β1xi1+β2xi2+⋯+βpxip+ϵ y i = β 0 + β 1 x i 1 + β 2 x i 2 + ⋯ + β p x i p + ϵ , i=1,2,⋯,n i = 1 , 2 , ⋯ , n
如果用 X 表示矩阵
X=⎡⎣⎢⎢⎢⎢⎢11⋮1x11x21⋮xn1x12x22⋮xn2⋯⋯⋱⋯x1px2p⋮xnp⎤⎦⎥⎥⎥⎥⎥=[1x1x2⋯xp] X = [ 1 x 11 x 12 ⋯ x 1 p 1 x 21 x 22 ⋯ x 2 p ⋮ ⋮ ⋮ ⋱ ⋮ 1 x n 1 x n 2 ⋯ x n p ] = [ 1 x 1 x 2 ⋯ x p ]
记 β=(β0,β1,β2