逻辑回归的交叉熵损失函数求导

最新推荐文章于 2025-03-29 19:34:25 发布

原创

最新推荐文章于 2025-03-29 19:34:25 发布 · 721 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#逻辑回归

本文详细介绍了逻辑回归的交叉熵损失函数，并通过数学推导展示了其求导过程，最终得到了损失函数关于参数的梯度表达式。这有助于理解逻辑回归模型的优化原理。

逻辑回归的交叉熵损失函数求导

定义的交叉熵损失函数为：

$J(\theta)=-\frac{1}{m} \sum_{i=1}^{m} y^{(i)} \log \left(h_{\theta}\left(x^{(i)}\right)\right)+\left(1-y^{(i)}\right) \log \left(1-h_{\theta}\left(x^{(i)}\right)\right)$
其中：
$\log h_{\theta}\left(x^{(i)}\right)=\log \frac{1}{1+e^{-\theta^{T} x^{(i)}}}=-\log \left(1+e^{-\theta^{T} x^{(i)}}\right)\\ \log \left(1-h_{\theta}\left(x^{(i)}\right)\right)=\log \left(1-\frac{1}{1+e^{-\theta^{T} x^{(i)}}}\right)=\log \left(\frac{e^{-\theta^{T} x^{(i)}}}{1+e^{-\theta^{T} x^{(i)}}}\right)\\ =\log \left(e^{-\theta^{T} x^{(i)}}\right)-\log \left(1+e^{-\theta^{T} x^{(i)}}\right)=-\theta^{T} x^{(i)}-\log \left(1+e^{-\theta^{T} x^{(i)}}\right)$