【ML】李宏毅机器学习二：Logistic Regression

最新推荐文章于 2023-08-31 17:16:12 发布

唐维康

最新推荐文章于 2023-08-31 17:16:12 发布

阅读量190

点赞数

分类专栏：深度学习李宏毅机器学习文章标签：【ML】李宏毅机器学习

本文链接：https://blog.csdn.net/taw19960426/article/details/102797227

版权

深度学习同时被 3 个专栏收录

5 篇文章 0 订阅

订阅专栏

李宏毅

4 篇文章 0 订阅

订阅专栏

机器学习

3 篇文章 0 订阅

订阅专栏

我们将在分类模型基础上继续，并开始学习一种常用的分类算法——Logistic回归，逻辑回归logistic regression，虽然名字是回归，但是实际上它是处理分类问题的算法。简单的说回归问题和分类问题如下：

回归问题：预测一个连续的输出。
分类问题：离散输出，比如二分类问题输出0或1。
逻辑回归常用于垃圾邮件分类，天气预测、疾病判断和广告投放。

一、Step 1: Function Set

同样考虑一个而分类问题，此时Function Set 为： $f_{x}=P_{w, b}\left(C_{1} | x\right)=\sigma(z)=\frac{1}{1+\exp \{-(w x+b)\}}$
如果 $P_{w, b}\left(C_{1} | x\right)>0.5$ ,class为 $C_{1}$ ，否则为 $C_{2}$
Sigmoid function
Function Set

在这里插入图片描述

二、Step 2: Goodness of a Function

在这里插入图片描述

Assume the data is generated based on $f_{w, b}(x)=P_{w, b}\left(C_{1} | x\right)$
Given a set of w and b, what is its probability of generating the data?
$b)=f_{w, b}\left(x^{1}\right) f_{w, b}\left(x^{2}\right)\left(1-f_{w, b}\left(x^{3}\right)\right) \cdots f_{w, b}\left(x^{N}\right)$
The most likely $w^{*}$ is the one with the largest $L (w, b)$ .
$w^{*}, b^{*}=\arg \max _{w, b} L(w, b)$

在这里插入图片描述

class $C_{1}$ 的标记 $\hat{y}$ 为1，class $C_{2}$ 的标记 $\hat{y}$ 为0

$b)=\prod_{i=1}^{n} P\left(C_{1} | x_{i}\right), \ln L=\sum_{i=1}^{n}\left[\hat{y}^{i} f_{w, b}\left(x^{i}\right)+\left(1-\hat{y}^{i}\right)\left(1-f_{w, b}\left(x^{i}\right)\right)\right]$

根据极大似然估计，为了极大化L，等价于极小化 $-\ln L$ ，求解得到
$w^{*}, b^{*}=\operatorname{argmin}_{w, b} \sum_{i=1}^{n}-\left[\hat{y}^{i} f_{w, b}\left(x^{i}\right)+\left(1-\hat{y}^{i}\right)\left(1-f_{w, b}\left(x^{i}\right)\right)\right]$

交叉熵 - cross entropy
$\left.C\left(f\left(x^{n}\right), (\hat{y}\right)^{n}\right)=-\left[\hat{y}^{n} f_{w, b}\left(x^{n}\right)+\left(1-\hat{y}^{n}\right)\left(1-f_{w, b}\left(x^{n}\right)\right)\right]$
表示Cross entropy between two Bernoulli distribution
Then the cross entropy is:
$q)=-\sum_{x} p(x) \ln (q(x))$