逻辑回归

最新推荐文章于 2022-05-11 20:40:39 发布

Jackson_zs

最新推荐文章于 2022-05-11 20:40:39 发布

阅读量64

点赞数

分类专栏： ML

ML 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

Logistic regression

目的：分类还是回归？经典的二分类算法！

机器学习算法选择：先用逻辑回归，再用复杂的，能简单尽量简单

逻辑回归的的决策边界：可以是非线性的

Sigmoid 函数
在这里插入图片描述
公式：
$h_{\theta }(x)=g(\theta ^{T}x)=\tfrac{1}{1+e^{-\theta ^{T}x}}$

自变量取值为任意实数，值域[0,1]

解释：将任意的输入映射到了[0,1]区间，我们在线性回归中可以得到一个预测值，再将该值映射到Sigmoid 函数中。这样就完成了由值到概率的转换，也就是分类任务

预测函数：
$h_{\theta }(x)=g(\theta ^{T}x)=\tfrac{1}{1+e^{-\theta ^{T}x}}\newline 其中：\theta _{0}+\theta _{1}x_{1}+,...,+\theta _{n}x_{n}=\sum _{i=1}^{n}\theta _{i}x_{i}=\theta ^{T}x$
分类任务：
$\begin{cases} P(y=1|x;\theta )=h_{\theta }(x)\\ P(y=0|x;\theta )=1-h_{\theta }(x) \end{cases}$
整合：
$P(y|x,\theta )=(h_{\theta }(x))^{y}(1-h_{\theta }(x))^{1-y}$
解释：对于二分类任务(0,1)，整合后y取0只保留 $(1-h_{\theta }(x))^{1-y}$ ，y取1只保留 $(h_{\theta }(x))^{y}$

似然函数：
$L(\theta )=\prod _{i=1}^{m}P(y_{i}|x_{i},\theta )=\prod _{i=1}^{m}(h_{\theta }(x_{i}))^{y_{i}}(1-h_{\theta }(x_{i}))^{1-y_{i}}$
对数似然：
$l(\theta )=L(\theta )=\sum _{i=1}^{m}(y_{i}\log h_{\theta }(x_{i})+(1-y_{i})\log (1-h_{\theta }(x_{i})))$
此时应用梯度上升求最大值，引入 $J(\theta )=-\tfrac{1}{m}l(\theta )$ 转换为小批量梯度下降求最小值任务

求导过程：
$\begin{aligned} \tfrac{\delta }{\delta _{\theta _{j}}}j(\theta ) &=-\tfrac{1}{m}\sum _{i=1}^{m}\left ( y_{i}\tfrac{1}{h_{\theta }(x_{i})}\tfrac{\delta }{\delta _{\theta _{j}}}-(1-y_{i})\tfrac{1}{1-h_{\theta }(x_{i})}\tfrac{\delta }{\delta _{\theta _{j}}}h_{\theta }(x_{i}) \right ) \\ &=-\tfrac{1}{m}\sum _{i=1}^{m}\left (y_{i}\tfrac{1}{g(\theta ^{T}x_{i})}-(1-y_{i})\tfrac{1}{1-g(\theta ^{T}x_{i})}\right )\tfrac{\delta }{\delta _{\theta _{j}}}g(\theta ^{T}x_{i}) \\ &=-\tfrac{1}{m}\sum _{i=1}^{m}\left (y_{i}\tfrac{1}{g(\theta ^{T}x_{i})}-(1-y_{i})\tfrac{1}{1-g(\theta ^{T}x_{i})}\right )g(\theta ^{T}x_{i})(1-g(\theta ^{T}x_{i}))\tfrac{\delta }{\delta _{\theta _{j}}}\theta ^{T}x_{i} \\ &=-\tfrac{1}{m}\sum _{i=1}^{m}\left ( y_{i}(1-g(\theta ^{T}x_{i}))-(1-y_{i})g(\theta ^{T}x_{i}) \right )x_{i}^{j} \\ &=-\tfrac{1}{m}\sum _{i=1}^{m}\left ( y_{i}-g(\theta ^{T}x_{i}) \right )x_{i}^{j} \\ &=\tfrac{1}{m}\sum _{i=1}^{m}\left ( h_{\theta }(x_{i})-y_{i} \right )x_{i}^{j} \end{aligned}$
参数更新：
$\theta _{j}:=\theta _{j}-\alpha \tfrac{1}{m}\sum _{i=1}^{m}(h_{\theta }(x_{i})-y_{i})x_{i}^{j}$
多分类的softmax：
$h_{\theta }(x^{(i)})=\begin{bmatrix} p(y^{(i)}=1|x^{(i)};\theta )\\ p(y^{(i)}=2|x^{(i)};\theta )\\ .\\ .\\ .\\ p(y^{(i)}=k|x^{(i)};\theta )\\ \end{bmatrix} =\tfrac{1}{\sum _{j=1}^{k}e^{\theta _{j}^{T}x^{(i)}}} \begin{bmatrix} e^{\theta _{1}^{T}x^{(i)}}\\ e^{\theta _{2}^{T}x^{(i)}}\\ .\\ .\\ .\\ e^{\theta _{k}^{T}x^{(i)}}\\ \end{bmatrix}$
总结：逻辑回归真的真的很好很好用

Jackson_zs

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
逻辑回归

Logistic regression目的：分类还是回归？经典的二分类算法！机器学习算法选择：先用逻辑回归，再用复杂的，能简单尽量简单逻辑回归的的决策边界：可以是非线性的Sigmoid 函数公式：hθ(x)=g(θTx)=11+e−θTxh_{\theta }(x)=g(\theta ^{T}x)=\tfrac{1}{1+e^{-\theta ^{T}x}}hθ(x)=g(θ...
复制链接

扫一扫