【机器学习】什么是线性回归、cost function以及常用的线性回归算法

最新推荐文章于 2023-07-13 16:16:20 发布

小冻子

最新推荐文章于 2023-07-13 16:16:20 发布

阅读量1.1k

点赞数 1

分类专栏：机器学习

本文链接：https://blog.csdn.net/weixin_38418878/article/details/102390771

版权

本文介绍了线性回归的基本概念，包括线性模型的表达形式，成本函数（均方误差）及其重要性，以及梯度下降法作为优化参数的算法。此外，还探讨了梯度下降的矩阵表示、归一化处理，以及正规方程作为直接求解参数的方法。文章最后对比了梯度下降和正规方程的优缺点，强调在实际问题中选择合适算法的重要性。

摘要由CSDN通过智能技术生成

我们首先通过回归问题中最简单的线性回归(Linear Regression)来了解什么是监督学习。
监督学习的模型一般可以表示成如下：
在这里插入图片描述
在监督学习的问题中，我们要找到一个函数h(x)，使得对于一个给定的数据集x，能预测出对应的输出y。即 $y = h (x)$
如果我们所要预测的y值是连续的，比如房价，那么这就是一个回归问题；如果y值是一些离散的点，比如是良性肿瘤还是恶性肿瘤，那么这就是一个分类问题。

线性回归

1.表达形式

所谓线性回归，就是y和x的关系是线性的。
在这里插入图片描述
对于只有一个特征的线性回归， $h_{\theta}(x)$ 可以表示成：
$h_{\theta}(x) = \theta_{1} x+\theta_{0}$

如果有多个特征，那么h(x)可以表示成：
$h_{\theta}(x)=\theta_{0}+\theta_{1}x_{1}+\theta_{2}x_{2}+...+\theta{n}x_{n}$

其中， $n$ 代表特征的个数。

2.cost function

代价函数(cost function)，有些地方也叫损失函数(loss function).它是用来衡量预测值 $h_{\theta}(x)$ 与真实值y之间的差异，记为 $J(\theta)$ 。需要注意的是，对于每种算法来说，cost function并不是唯一的。如果 $J(\theta)$ 的值越小，那么说明模型和参数越符合训练样本。
训练参数的过程就是不断地改变 $\theta$ ，从而得到更小的 $J(\theta)$ 的过程。
一个好的cost function需要满足两个最基本的要求：(1)能够评价模型的准确性（2）对参数 $\theta$ 可微。
在线性回归中，最常用的cost function就是均方误差(Mean squared error).具体表现形式是：
$J(\theta_0,\theta_1,...\theta_n)=\frac{1}{2m}\sum_{i=1}^{m}(\hat{y}^{(i)}-y^{(i)})^2=\frac{1}{2m}\sum_{i=1}^{m}(h_\theta(x_0^{(i)},x_1^{(i)},...x_n^{(i)})-y^{(i)})^2$

最低0.47元/天解锁文章

小冻子

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
【机器学习】什么是线性回归、cost function以及常用的线性回归算法

我们首先通过回归问题中最简单的线性回归(Linear Regression)来了解什么是监督学习。监督学习的模型一般可以表示成如下：在监督学习的问题中，我们要找到一个函数h(x)，使得对于一个给定的数据集x，能预测出对应的输出y。即 y=h(x)y = h(x)y=h(x)如果我们所要预测的y值是连续的，比如房价，那么这就是一个回归问题；如果y值是一些离散的点，比如是良性肿瘤还是恶性肿瘤，...
复制链接

扫一扫