梯度下降
基本概念:
梯度下降是在监督学习中,为了优化模型参数,求出损失函数J(θi)(loss function)取得最小值时,对应的参数θ值的一种迭代算法
数学公式:
对于一般的线性回归,假设函数可表示为:
h θ ( x ) = θ 0 x 0 + θ 1 x 1 + θ 2 x 3 + . . . + θ n x n h_\theta(x) = \theta_0x_0 + \theta_1x_1 + \theta_2x_3 + ... + \theta_nx_n hθ(x)=θ0x0+θ1x1+θ2x3+...+θnxn
其中n为样本特征数, θ i \theta_i θi(i = 0, 1, 2 … n) 为模型参数, x i x_i xi(i = 0, 1, 2 … n) 为每个样本的n个特征值,将上式化简后可得:
h θ ( x ) = ∑ i = 0 n θ i x i h_\theta(x) = \sum_{i=0}^n\theta_ix_i hθ(x)=i=0∑nθixi
对于上面的假设函数,其损失函数 (平方损失函数)可表示为:
J ( θ 1 , θ 2 .