Logistic回归推导（一）--模型介绍

最新推荐文章于 2024-05-28 17:00:30 发布

气泡水、

最新推荐文章于 2024-05-28 17:00:30 发布

阅读量2.2k

点赞数 1

分类专栏：机器学习文章标签：逻辑回归机器学习 python

本文链接：https://blog.csdn.net/m0_50117360/article/details/108864158

版权

机器学习专栏收录该内容

7 篇文章 3 订阅

订阅专栏

一、Logistic回归

Logistic回归是一种二分类模型，它有一个线性决策边界(超平面)，但用一个非线性激活函数(Sigmoid函数)来模拟后验概率。
在这里插入图片描述

二、Sigmoid函数

1、数学公式

$f(x)=\frac{1}{1+e^{-x}}$
在这里插入图片描述
sigmoid函数和其反函数都是严格单调递增的，常用作阈值函数，将变量映射到（0，1）内。

2、求导 $f^{'}(x)=F(f(x))$

$\begin{aligned} f^{'}(x)&=\left(\frac{1}{1+e^{-1}}\right)^{'}=\frac{0-(-e^{-x})}{(1+e^{-x})^{2}}\\ &=\frac{e^{-x}}{(1+e^{-x})^{2}}\\ &=\frac{1}{1+e^{-x}} \cdot \left(1-\frac{1}{1+e^{-x}} \right) \\ &=f(x)(1-f(x)) \end{aligned}$

三、伯努利分布

$\left\{ \begin{aligned} P(x=1)& = p, \quad 0< p < 1\\ P(x=0) & = 1-p \end{aligned} \right.$
对于随机变量x的概率函数：
$f(x|p)=\left\{ \begin{aligned} &p^{x}(1-p)^{1-x},& \quad x=0,1\\ &0, & \quad x \neq 0,1 \end{aligned} \right.$

四、Logistic回归假设函数

线性回归是一个回归算法，而Logistic回归是一个分类算法，其样本数据集是一个离散分布的样本集，模型值是{0，1}这样的离散值而非连续值。通过sigmoid函数可将线性回归与Logistic回归联系起来。
$h_{\theta}(x)=\delta (\theta^{T}x)=\frac{1}{1+e^{-\theta^{T}x}}$
在Logistic回归中作一个假设：样本事件符合伯努利分布，即0-1分布，则
$\begin{aligned} P(y=1|x;\theta)&=h_{\theta}(x)=\frac{1}{1+e^{-\theta^{T}x}}\\ P(y=1|x;\theta)&=1-h_{\theta}(x) \end{aligned}$
简化形式为：
$P(y|x;\theta)=[h_{\theta}(x)]^{y}[1-h_{\theta}(x)]^{(1-y)}$

五、似然函数

$\begin{aligned} L(\theta)&=\prod_{i=1}^{N}P(y^{(i)}|x^{i};\theta)\\ &=\prod_{i=1}^{N}[h_{\theta}(x^{(i)})]^{y^{(i)}}[1-h_{\theta}(x^{(i)})]^{(1-y^{(i)})}\\ &=\prod_{i=1}^{N}(\frac{1}{1+e^{-\theta^{T}x^{(i)}}})^{y^{(i)}}(1-\frac{1}{1+e^{-\theta^{T}x^{(i)}}})^{1-y^{(i)}} \end{aligned}$
Logistic回归的目标函数即为对数似然函数，进行最大似然估计则可求解
$\underset{\theta}{max}\Leftrightarrow \underset{\theta}{max}\sum_{i=1}^{n}[y^{(i)}lnh_{\theta}(x^{(i)})+(1-y^{(i)})ln(1-h_{\theta}(x^{(i)}))]$