机器学习算法（一）

最新推荐文章于 2022-08-27 18:55:16 发布

huahuahuahhhh

最新推荐文章于 2022-08-27 18:55:16 发布

阅读量321

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/Blankit1/article/details/102703268

版权

机器学习专栏收录该内容

26 篇文章 0 订阅

订阅专栏

一、线性回归

给定一组数据 $x_{i},y_{i})$ ， $y_{i}$ 是连续的，用线性模型 $\hat{y}_{i}=h_{\theta}(x_{i})=\theta^{T}x_{i}$ ，估计值 $\hat{y}_{i}$ 与实际值 $y_{i}$ 间存在误差 $\varepsilon_{i}$ ，即
$y_{i}=\theta^{T}x_{i}+\varepsilon_{i}(1)$ .
误差 $\varepsilon_{i}$ 属于独立同分布的，根据大数定理， $\varepsilon_{i} \sim\mu(0,\sigma^{2})$ ,则有：
$p(\varepsilon_{i} ) = \frac{1}{\sqrt{2\pi}}e^{-\frac{\varepsilon_{i}^{2}}{\sigma^{2}}}(2)$
$\varepsilon_{i}=y_{i}-\theta^{T}x_{i}$ 带入(2)式有，
$p(y_{i}|x_{i},\theta ) =\frac{1}{\sqrt{2\pi}}e^{-\frac{(y_{i}-\theta^{T}x_{i})^{2}}{\sigma^{2}}} (3)$
转成了 $x_{i},\theta$ 已知的情况下， $y_{i}$ 发生的概率。
最大似然函数为
$L(\theta)=\Pi_{i=1}^{m}p(y_{i}|x_{i},\theta )(4)$
将（3）式带入(4)中，然后取对数，最后得到
$J(\theta)=\frac{1}{2}\Sigma_{i=1}^{m}(h_{\theta}(x_{i})-y_{i})^{2}=\frac{1}{2}(\theta^{T}X-Y)^{T}(\theta^{T}X-Y)$
通过最小二乘法，求出参数 $\theta$

方法二：最小均方误差（整体误差的平方和最小，几何方法）
$cost(\theta)=min{\frac{1}{2}\Sigma_{i=1}^{m}(h_{\theta}(x_{i})-y_{i})^{2}} (5)=min{\frac{1}{2}(\theta^{T}X-Y)^{T}(\theta^{T}X-Y)}$
为了求(5)式的最小值，由于 $cost(\theta)>=0$ ，对 $\theta$ 求导，导数为0的点记为参数 $\theta$ 的值，即可得出线性模型 $\hat{y}_{i}=h_{\theta}(x_{i})=\theta^{T}x_{i}$

在这里插入图片描述

在 $X^{T}X$ 中加入了 $\lambda$ 后，带入 $J(\theta)$ 中，

在这里插入图片描述

逻辑斯谛回归

假设数据服从二项分布，得到数据分布律： $p(y|x;\theta) = (h_{\theta}(x_{i})^{y_{i}}(1-h_{\theta}(x_{i}))^{1-y_{i}}$
通过求逻辑斯谛回归的最大似然，求解模型的参数 $\theta$ .解析法求解参数比较难，用梯度下降法求解
在这里插入图片描述

二、通过交叉验证选取超参数

三、梯度下降算法

huahuahuahhhh

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习算法（一）

一、线性回归给定一组数据(xi,yi)(x_{i},y_{i})(xi,yi)，yiy_{i}yi是连续的，用线性模型y^i=hθ(xi)=θTxi\hat{y}_{i}=h_{\theta}(x_{i})=\theta^{T}x_{i}y^i=hθ(xi)=θTxi，估计值y^i\hat{y}_{i}y^i与实际值yiy_{i}yi间存在误差εi\varepsilon_{...
复制链接

扫一扫

专栏目录