第四课.判别式模型

tzc_fly

于 2021-03-30 13:05:35 发布

阅读量847

点赞数 1

分类专栏：随机过程与概率图模型

本文链接：https://blog.csdn.net/qq_40943760/article/details/115319120

版权

随机过程与概率图模型专栏收录该内容

23 篇文章 17 订阅

订阅专栏

线性回归到线性分类

线性回归： $y=w^{T}x+b$ ，得到结果是一个属于 $(-\infty,+\infty)$ 的实数，线性分类问题则需要映射 $w^{T}x+b$ 到类别的编码上，分类问题有硬分类和软分类两种情况，假设有一个二分类问题：

硬分类，映射结果是二值集合{ $0, 1$ }中的值；
软分类，映射结果是 $[0, 1]$ 区间上的值，相比硬分类，软分类取到的是概率值，哪个类别的概率大，就认为是哪一类；

软分类的线性分类模型一般有三种：逻辑回归，高斯判别分析，朴素贝叶斯分类器；

软分类模型又可以分为判别式模型和生成式模型，逻辑回归属于判别式模型，直接对条件概率 $p (Y ∣ X)$ 建模；高斯判别分析和朴素贝叶斯是生成式模型，对联合概率 $p (X, Y)$ 进行建模；

逻辑回归建模

以二分类问题为例，在逻辑回归中，所关注的是给定一个样本 $x$ ，计算 $p (y = 1 ∣ x)$ 的概率，通常会利用sigmoid函数对 $w^{T}x$ 进行非线性映射，映射到 $[0, 1]$ 之间的概率值；

逻辑回归的二分类条件概率表达式为：
$p_{1}=p(y=1|x)=\sigma(w^{T}x)=\frac{1}{1+e^{-w^{T}x}}=\varphi(x,w)$
$p_{0}=p(y=0|x)=1-p(y=1|x)=1-\sigma(w^{T}x)=\frac{e^{-w^{T}x}}{1+e^{-w^{T}x}}=1-\varphi(x,w)$
综合起来，把两个分类的条件概率统一到一个表达式中：
$p(y|x)=p_{1}^{y}p_{0}^{1-y}$
这就是对条件概率进行建模，带估计参数即向量 $w$ ；

逻辑回归参数估计

面对样本数量为 $N$ 的数据集 $(X, Y)$ ，先通过极大似然估计的思路求解 $w$ ：
$w_{mle}=argmax_{w}log(p(Y|X))=argmax_{w}log\prod_{i=1}^{N}p(y_{i}|x_{i})=argmax_{w}\sum_{i=1}^{N}log(p(y_{i}|x_{i}))$
即：
$w_{mle}=argmax_{w}\sum_{i=1}^{N}(y_{i}logp_{1}+(1-y_{i})logp_{0})=argmax_{w}\sum_{i=1}^{N}(y_{i}log(\varphi(x,w))+(1-y_{i})log(1-\varphi(x,w)))$
至此，得到逻辑回归的目标：
$w_{mle}=argmin_{w}[-\sum_{i=1}^{N}(y_{i}log(\varphi(x,w))+(1-y_{i})log(1-\varphi(x,w)))]$
一般来说，对于该目标，采用梯度下降逐步逼近 $w$ 的局部最优值。

tzc_fly

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
第四课.判别式模型

目录线性回归到线性分类逻辑回归建模逻辑回归参数估计线性回归到线性分类线性回归：y=wTx+by=w^{T}x+by=wTx+b，得到结果是一个属于(−∞,+∞)(-\infty,+\infty)(−∞,+∞)的实数，线性分类问题则需要映射wTx+bw^{T}x+bwTx+b到类别的编码上，分类问题有硬分类和软分类两种情况，假设有一个二分类问题：硬分类，映射结果是二值集合{0,10,10,1}中的值；软分类，映射结果是[0,1][0,1][0,1]区间上的值，相比硬分类，软分类取到的是概率值，哪个类
复制链接

扫一扫

专栏目录