机器学习之逻辑回归（二）

最新推荐文章于 2023-06-17 00:22:47 发布

大龄coder

最新推荐文章于 2023-06-17 00:22:47 发布

阅读量105

点赞数

分类专栏：读书笔记西瓜书机器学习文章标签：机器学习逻辑回归 latex

本文链接：https://blog.csdn.net/weixin_42341153/article/details/88959732

版权

机器学习同时被 3 个专栏收录

19 篇文章 0 订阅

订阅专栏

读书笔记

17 篇文章 0 订阅

订阅专栏

西瓜书

3 篇文章 0 订阅

订阅专栏

逻辑回归

线性回归模型的作用是来预测，如果我们的任务是分类呢，可以对线性回归模型进行改造，找一个单调可微的函数将输出值转换为0/1，从而达到分类的效果。对数几率函数是一个常用的这样的函数， $y=\frac1{1+e{-x}}$ ,图像如下，函数处处可微，且函数值处于0-1之间，

sigmoid函数

这样我们的函数模型可以写作：

$y=\frac1{1+e^{-(w^Tx+b)}}$

上式可以变化为：

$ln\frac{y}{1-y}=w^Tx+b$

若将y视为样本x作为正例的可能性，1-y是反例可能性，两者的比值称为“几率”（odds），反映了x作为正例的相对可能性。

我们通过“极大似然法”来估计w和b，给定数据集 ${(x_i,y_i)}_{i=1}^m$ ,对数回归模型最大化“对数似然”

$l(w,b)=\sum_{i=1}^mlnp(y_i|x_i;w,b)$

即令每个样本属于其真实标记的概率越大越好，为便于讨论令 $\beta=(w:b)$ ， $\hat{x}=(x;1)$ ,则 $w^Tx+b$ 可写作 $\beta^T\hat{x}$ ，再令 $p_1(\hat{x};\beta)=p(y=1|\hat{x};\beta)$ , $p_0(\hat{x};\beta)=p(y=0|\hat{x};\beta)=1-p_1(\hat{x};\beta)$ ,则上式后面的似然项可写作：

$p(y_i|x_i;w,b)=y_ip_1(\hat{x};\beta)+(1-y_i)p_0(\hat{x};\beta)$

将其带入得：

$l(\beta)=\sum_{i=1}^m(-y_i\beta^T\hat{x}+ln(1+e^{\beta^T\hat{x}}))$

上式是一个凸函数，因此可以用梯度下降的方法求得最优解：

$\beta^*=\mathop{\arg\min}_{\beta}l(\beta)$

以牛顿法为例：

$\beta^{t+1}=\beta^t-(\frac{\partial^2l(\beta)}{\partial{\beta}\partial{\beta^T}})^{-1}\frac{\partial{l(\beta)}}{\partial{\beta}}$

其中一二阶导数分别为：

$\frac{\partial{l(\beta)}}{\partial{\beta}}=-\sum_{i=1}^m\hat{x_i}(y_i-p_1(\hat{x_i};\beta))$

$\frac{\partial^2l(\beta)}{\partial{\beta}\partial{\beta^T}}=\sum_{i=1}^m\hat{x_i}\hat{x_i}^Tp_1(\hat{x_i};\beta)(1-p_1(\hat{x_i};\beta))$

以上；

大龄coder

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习之逻辑回归（二）

逻辑回归线性回归模型的作用是来预测，如果我们的任务是分类呢，可以对线性回归模型进行改造，找一个单调可微的函数将输出值转换为0/1，从而达到分类的效果。对数几率函数是一个常用的这样的函数，y=11+e−xy=\frac1{1+e{-x}}y=1+e−x1,图像如下，函数处处可微，且函数值处于0-1之间，这样我们的函数模型可以写作：y=11+e−(wTx+b)y=\frac1{1+e^{-(...
复制链接

扫一扫