机器学习基石-Logistic Regression

最新推荐文章于 2018-12-27 11:12:45 发布

遇见更好的自己

最新推荐文章于 2018-12-27 11:12:45 发布

阅读量218

点赞数

分类专栏：机器学习台大林轩田机器学习课程笔记文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yc1203968305/article/details/78585392

版权

机器学习同时被 2 个专栏收录

42 篇文章 2 订阅

订阅专栏

台大林轩田机器学习课程笔记

27 篇文章 5 订阅

订阅专栏

大纲

这里写图片描述

Logistic Regression

例子

一般的二分类问题，比如说是否患有心脏病

这里写图片描述

软性二分类问题，这个值接近1,表示患病的可能性越大，越接近0，表示患病的可能性越小。

Soft Binary Classification

对于软性二分类问题，理想的数据是分布在[0,1]之间的具体值，但是实际中的数据只可能是0或者1，我们可以把实际中的数据看成是理想数据加上了噪声的影响。

这里写图片描述

Logistic Hypothesis

我们可以通过logistic function，把实数值映射到(0,1)区间
这里写图片描述

Logistic Regression Error

LikeHood

首先我们假定，我们的目标函数是 $f(x) = p(+1/x)$

这里写图片描述

然后我们计算 $f$ 生成数据 $D$ 的概率

这里写图片描述

然后我们从假设空间中取出一个 $h$ ，计算 $h$ 生成数据 $D$ 的概率

这里写图片描述

如果我们最大化 $h$ 生成 $D$ 的概率，就可以让 $h \approx f$

那么就有

这里写图片描述

Gradient of Logistic Regression Error

有了损失函数，我们就可以最小化损失函数。

Minimizing $E_{in}(w)$

因为我们可以知道 $E_{in}(w)$ 是一个连续可导的凸函数，在梯度为0的地方可以取得最小值

这里写图片描述

The Gradient of $E_{in}(w)$

这里写图片描述

如上图所示，我们可以把梯度看成 $\theta(\cdot)$ 作为权重的， $(-y_nx_n)的线性组合$ ，我们可以分为两种来考虑

一种是所有的 $\theta(\cdot)=0$ ，只有当 $y_nW^Tx_n$ 远远大于0的时候才可以满足，也就是说数据是线性可分的
但数据往往是线性不可分的，所以我们考虑加权和为0，可以通过解这个非线性的等式，没有闭式解

Gradient Descent

Iteration Solution

上文说道解非线性方程，没有闭式解，我们可以采取一种迭代的方式来逐步优化

这里写图片描述

逐步优化分为两部分

direction $v$ ,优化的方向，假定是单位长度
step size $\eta$ ,优化的步长，假定是正数
每步确定好这两个量，就可以进行优化

Linear Approximation

如果这解这个最小化问题，还是个非线性优化，而且还带有约束，难度没有减小

这里写图片描述

我们可以通过泰勒公式展开，进行线性近似。假定 $\eta$ 很小

这里写图片描述

对于一个正数 $\eta$ ,当下降的方向 $v$ 和梯度的方向相反时，减少的最多

我们可以把更新公式写为

w t + 1 \Leftarrow w t - η ▿ E i n ( W ) ∥ ▿ E i n ( W ) ∥

$w_{t+1} \Leftarrow w_{t}-\eta\frac{\triangledown E_{in}(W)}{\Vert{\triangledown E_{in}(W)}\Vert}$

chioce of $\eta$

这里写图片描述

由上图可知， $\eta$ 最好和 $\Vert{\triangledown E_{in}(W)}\Vert$ 成比例

那么我们令 $\color{red}{\eta} = \frac{\eta}{\Vert{\triangledown E_{in}(W)}\Vert}$

那么我们的公式可以更新为

w t + 1 \Leftarrow w t - η ▿ E i n (W)

$w_{t+1} \Leftarrow w_{t}-\color{red}{\eta}\triangledown E_{in}(W)$

Conclusion

这里写图片描述

遇见更好的自己

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习基石-Logistic Regression

大纲Logistic Regression例子一般的二分类问题，比如说是否患有心脏病软性二分类问题，这个值接近1,表示患病的可能性越大，越接近0，表示患病的可能性越小。Soft Binary Classification对于软性二分类问题，理想的数据是分布在[0,1]之间的具体值，但是实际中的数据只可能是0或者1，我们可以把实际中的数据看成是理想数据加上了噪声的影响。Logistic Hypoth
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。