【机器学习】什么是线性回归、cost function以及常用的线性回归算法

本文介绍了线性回归的基本概念,包括线性模型的表达形式,成本函数(均方误差)及其重要性,以及梯度下降法作为优化参数的算法。此外,还探讨了梯度下降的矩阵表示、归一化处理,以及正规方程作为直接求解参数的方法。文章最后对比了梯度下降和正规方程的优缺点,强调在实际问题中选择合适算法的重要性。
摘要由CSDN通过智能技术生成

我们首先通过回归问题中最简单的线性回归(Linear Regression)来了解什么是监督学习。
监督学习的模型一般可以表示成如下:
在这里插入图片描述
在监督学习的问题中,我们要找到一个函数h(x),使得对于一个给定的数据集x,能预测出对应的输出y。即 y = h ( x ) y = h(x) y=h(x)
如果我们所要预测的y值是连续的,比如房价,那么这就是一个回归问题;如果y值是一些离散的点,比如是良性肿瘤还是恶性肿瘤,那么这就是一个分类问题。

线性回归

1.表达形式

所谓线性回归,就是y和x的关系是线性的。
在这里插入图片描述
对于只有一个特征的线性回归, h θ ( x ) h_{\theta}(x) hθ(x)可以表示成:
h θ ( x ) = θ 1 x + θ 0 h_{\theta}(x) = \theta_{1} x+\theta_{0} hθ(x)=θ1x+θ0

如果有多个特征,那么h(x)可以表示成:
h θ ( x ) = θ 0 + θ 1 x 1 + θ 2 x 2 + . . . + θ n x n h_{\theta}(x)=\theta_{0}+\theta_{1}x_{1}+\theta_{2}x_{2}+...+\theta{n}x_{n} hθ(x)=θ0+θ1x1+θ2x2+...+θnxn

其中, n n n代表特征的个数。

2.cost function

代价函数(cost function),有些地方也叫损失函数(loss function).它是用来衡量预测值 h θ ( x ) h_{\theta}(x) hθ(x)与真实值y之间的差异,记为 J ( θ ) J(\theta) J(θ)。需要注意的是,对于每种算法来说,cost function并不是唯一的。如果 J ( θ ) J(\theta) J(θ)的值越小,那么说明模型和参数越符合训练样本。
训练参数的过程就是不断地改变 θ \theta θ,从而得到更小的 J ( θ ) J(\theta) J(θ)的过程。
一个好的cost function需要满足两个最基本的要求:(1)能够评价模型的准确性 (2)对参数 θ \theta θ可微
在线性回归中,最常用的cost function就是均方误差(Mean squared error).具体表现形式是:
J ( θ 0 , θ 1 , . . . θ n ) = 1 2 m ∑ i = 1 m ( y ^ ( i ) − y ( i ) ) 2 = 1 2 m ∑ i = 1 m ( h θ ( x 0 ( i ) , x 1 ( i ) , . . . x n ( i ) ) − y ( i ) ) 2 J(\theta_0,\theta_1,...\theta_n)=\frac{1}{2m}\sum_{i=1}^{m}(\hat{y}^{(i)}-y^{(i)})^2=\frac{1}{2m}\sum_{i=1}^{m}(h_\theta(x_0^{(i)},x_1^{(i)},...x_n^{(i)})-y^{(i)})^2 J(θ0,θ1,...θn)=2m1i=1m(y^(i)y(i))2=2m1i=1m(hθ(x0(i),x1(i),...xn(i)</

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值