机器学习算法基础二回归

不可描述的两脚兽

于 2020-02-05 01:25:04 发布

阅读量170

点赞数

分类专栏：机器学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_22096121/article/details/104176067

版权

机器学习专栏收录该内容

12 篇文章 0 订阅

订阅专栏

连续数据 —— 回归
离散数据 —— 分类

文章目录

线性回归
似然函数
聊聊“假设”
$\theta$ 的求解过程
机器学习与数据使用
Moore-Penrose广义逆矩阵（伪逆）
梯度下降算法
Logistic回归
广义线性模型GLM
Softmax回归

线性回归

在这里插入图片描述
建模的过程实际就是找参数a、b两个变量的值。

以房屋价格为例考虑两个特征居室数和房屋面积。
在这里插入图片描述

$模型h_\theta(x)的第一项可以看成是\theta_0x_0，只不过使得x_0恒为1。$ $这样可令参数向量为\overrightarrow{\theta}=[\theta_0,\theta_1,\theta_2],\overrightarrow{x}=[1,x_1,x_2]。可推h_\theta(x)=\theta^Tx$
$模型h_\theta(x)：x是样本，\theta是要估计出的参数。我们建模的主要工作就是根据x_1,x_2估算出合理的\theta_0,\theta_1,\theta_2。$

多个变量的情形就是增加样本 $x$ 的维度（特征个数）

那么，实际的值为估测值+误差
$y^{(i)}=\theta^Tx^{(i)}+\varepsilon^{(i)}$
$误差\varepsilon^{(i)}(1\le i \le m)是\underline{独立分布的}，服从均值为0，方差为某定值\sigma^2的\underline{高斯分布}。$ 原因：中心极限定理

似然函数

在这里插入图片描述

目标函数（损失函数）： $J(\theta)$ ，预测值 - 实际值的平法做累加，这不是最小二乘（假定服从高斯分布且认为样本是独立的使用最大似然估计就可以得出结论）。

聊聊“假设”

在这里插入图片描述

$\theta$ 的求解过程

计算最优解
在这里插入图片描述
半正定为凸函数

我们希望参数值不要太大。

L1正则——LASSO——高阶项系数越来越趋近于0，表示特征选择。
L2正则——Ridge
二者结合Elastic-Net

机器学习与数据使用

在这里插入图片描述
十折交叉验证：将数据分成十份，9份作为训练数据，1份作为验证数据。这样的验证可以做10次，再取10次的平均结果。

Moore-Penrose广义逆矩阵（伪逆）

如果X是可逆矩阵： $X\theta=y \Rightarrow \theta = X^{-1}y$
如果X不可逆矩阵： $X\theta=(X^TX)^{-1}·X^Ty$

在这里插入图片描述

梯度下降算法

在这里插入图片描述

实践中使用最多的mini-batch但通常简称SGD

不建议用回归做分类问题：

线性回归在很多场景下比较差：

Logistic回归

在这里插入图片描述

回归参数估计

在这里插入图片描述

参数迭代，不断地得到参数值（可以写代码了）

对数线性模型

在这里插入图片描述

扩展知识点损失函数

在这里插入图片描述

{-1,1}形式更漂亮

复习：指数族
指数族概念的目的，是为了说明广义线性模型Generalized Linear Models
凡是符合指数族分布的随机变量，都可以用GLM回归分析

广义线性模型GLM

在这里插入图片描述

Softmax回归

在这里插入图片描述

不可描述的两脚兽

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习算法基础二回归

机器学习算法基础回归
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。