机器学习：线性模型

最新推荐文章于 2024-07-25 18:25:30 发布

锅巴不写代码

最新推荐文章于 2024-07-25 18:25:30 发布

阅读量799

点赞数

分类专栏：机器学习文章标签：机器学习回归人工智能

本文链接：https://blog.csdn.net/weixin_45095281/article/details/122011614

版权

机器学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

机器学习：线性模型

基本形式
线性回归 linear regression

基本形式

一般向量形式为： $f(x)=w^Tx+b$
其中， $w$ 表示了 $x$ 的重要性，称为权重。

线性回归 linear regression

线性回归学习一个线性模型来预测输出.
即, 在一个数据集 $D=\{(x_1, y_1),(x_2,y_2),...,(x_n,y_n)\}$ 中，对第 $i$ 个样本有

$f(x_i)=w^Tx_i+b$ 使
$f(x_i) \approx y_i$

优化

为了让 $f(x_i) \approx y_i$ ，就要使二者的差别减小，他们之间的差别用均方误差计算，均方误差对应欧几里得距离。
线性回归问题就转化为求解最小化 $f(x_i)$ 与 $y_i$ 的均方误差。
基于均方误差最小化进行模型求解的方法成为最小二乘法（least square method）。
最小二乘法：
在线性回归中，最小二乘法就是试图找到一条直线，使得所有样本到直线上的欧氏距离之和最小。
$=\sum_{i=0}^n||f(x_i)-y_i||_2=\sum_{i=0}^n||w^Tx_i+b-y_i||_2$ 当
$\frac{\partial error}{\partial{w}}=2\sum_{i=1}^n(wx_i^2-(y_i-b)x_i)=0\\ \frac{\partial error}{\partial{b}}=2\sum_{i=1}^n(wx_i+b-y_i)=0$ 就可求得 $w$ 和 $b$ ，推导过程如下：
$w\sum^m_{i=1}x^2_i=\sum^m_{i=1}(y_i-b)x_i\ \ \ \ \ \ \ (1)\\ mb=\sum^m_{i=1}(y_i-wx_i)\ \ \ \ \ \ \ (2)$

首先由 $mb=\sum^m_{i=1}(y_i-wx_i)$ 得到：
$b=\frac{1}{m}\sum^m_{i=1}(y_i-wx_i)$

$=\frac{1}{m}\sum^m_{i=1}y_i-\frac{1}{m}\sum^m_{i=1}wx_i$

$=\bar{y}-w\bar{x}$
将 $b=\bar{y}-w\bar{x}$ 带入 (1) 式：
$w\sum^m_{i=1}x^2_i=\sum^m_{i=1}y_ix_i-\sum^m_{i=1}bx_i$

$=\sum^m_{i=1}y_ix_i-\sum^m_{i=1}(\bar{y}-w\bar{x})x_i$

$=\sum^m_{i=1}y_ix_i-\bar{y}\sum^m_{i=1}x_i+w\bar{x}\sum^m_{i=1}x_i$

则，
$w\sum^m_{i=1}x^2_i-w\bar{x}\sum^m_{i=1}x_i=\sum^m_{i=1}y_ix_i-\bar{y}\sum^m_{i=1}x_i$

$w(\sum^m_{i=1}x^2_i-\bar{x}\sum^m_{i=1}x_i)=\sum^m_{i=1}y_ix_i-\bar{y}\sum^m_{i=1}x_i$

得到， $w=\frac{\sum^m_{i=1}y_ix_i-\bar{y}\sum^m_{i=1}x_i}{(\sum^m_{i=1}x^2_i-\bar{x}\sum^m_{i=1}x_i)}\ \ \ \ (3)$ 其中 $\bar{y}=\frac{1}{m}\sum^m_{i=1}y_i$ ，因此 $\bar{y}\sum^m_{i=1}x_i=\frac{1}{m}\sum^m_{i=1}y_i\sum^m_{i=1}x_i=\bar{x}\sum^m_{i=1}y_i\ \ \ \ \ (4)$ 又因为 $\bar{x}=\sum^m_{i=1}x_i$ ，因此
$\bar{x}\sum^m_{i=1}x_i=\frac{1}{m}\sum^m_{i=1}x_i\sum^m_{i=1}x_i=\frac{1}{m}(\sum^m_{i=1}x_i)^2\ \ \ \ \ (5)$ (4)，(5)带入(3)得
$w=\frac{\sum^m_{i=1}y_i(x_i-\bar{x})}{\sum^m_{i=1}x^2_i-\frac{1}{m}(\sum^m_{i=1}x_i)^2}$

对数线性回归

当输出是在指数尺度上变化时，
$lny=w^Tx+b$ 则 $y=e^{w^Tx+b}$ 这就变成了输入到输出的非线性映射， $l n (\cdot)$ 将线性回归模型的预测值与真实标记联系起来。

对数几率回归

在二分类任务中，输出为 $y\in\{0,1\}$ , 需要将线性回归模型产生结果转为0/1。
这里引入对数几率函数，这是一种常见的sigmoid函数。
在这里插入图片描述
公式为：
$y=\frac{1}{1+e^{-z}}, z=w^T+b$ 因此，
$y=\frac{1}{1+e^{-(w^Tx+b)}}$ 然而线性回归的一般形式为：
$f(x)=w^T+b$ 则 $ln\frac{y}{1-y}=w^T+b$ 简单证明一下上式：

$y=\frac{1}{1+e^{-(w^Tx+b)}}=\frac{e^{(w^Tx+b)}}{e^{(w^Tx+b)}+1}$

$1-y==\frac{1}{e^{(w^Tx+b)}+1}$

$\frac{y}{1-y}=e^{(w^Tx+b)}$ ，两边分别取对数就得到结论。

我们假设 $y$ 为样本 $x$ 是正例的概率，则 $1 - y$ 为反例的概率，二者的比值为：
$\frac{y}{1-y}$

锅巴不写代码

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习：线性模型

机器学习：线性模型基本形式线性回归 linear regression优化对数线性回归对数几率回归基本形式一般向量形式为： f(x)=wTx+bf(x)=w^Tx+bf(x)=wTx+b其中，www 表示了 xxx 的重要性，称为权重。线性回归 linear regression线性回归学习一个线性模型来预测输出.即, 在一个数据集 D={(x1,y1),(x2,y2),...,(xn,yn)}D=\{(x_1, y_1),(x_2,y_2),...,(x_n,y_n)\}D={(x1,y1
复制链接

扫一扫

专栏目录