softmax回归，你会求导吗？

最新推荐文章于 2024-06-27 13:48:28 发布

DLlite

最新推荐文章于 2024-06-27 13:48:28 发布

阅读量9.1k

点赞数 5

分类专栏：机器学习文章标签： softmax回归

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/WangCaihua321/article/details/47298363

版权

本文探讨了softmax回归的导数计算问题，指出直接对目标函数求导的不妥之处，并提供了softmax似然函数的定义。作者强调了softmax的排他性，即每次只有一个值为1，其他为0，从而引出对目标函数的正确理解。文章旨在解答为何不能直接对常见定义的目标函数求导，并鼓励读者提出不同观点。

摘要由CSDN通过智能技术生成

前言
关于softmax回归，有比较多的资料，本来没有必要再写一次的。下面是一些网址：
1）http://deeplearning.stanford.edu/wiki/index.php/Softmax%E5%9B%9E%E5%BD%92
2）http://ufldl.stanford.edu/wiki/index.php/Softmax_Regression
3）http://blog.csdn.net/acdreamers/article/details/44663305
4）http://www.cnblogs.com/fanyabo/p/4060498.html
还有很多，不一一列出。

softmax 中的导数是怎样得到的？
为什么对网站上给出的目标函数直接求导是不对的？
为了解答这些问题，我决定写这篇文章。

注：如果你认为我是错的，请让我知道，先谢过了。

问题提出
按定义(一般资料中的定义)，softmax的似然函数为：

\prod i \prod k P k (x i) I (y (i) = k)

$\prod_i \prod_k P_k(x_i)^{I(y^{(i)}=k)}$
其中

k∈{ 1,2,⋯,K} $k \in \{1,2,\cdots,K\}$ ,

i∈{ 1,2,⋯,N} $i \in \{1,2,\cdots,N\}$ ,

Pk(xi) $P_k(x_i)$ 按softmax概率定义有：

P k (x i) = e θ T k x i \sum K l = 1 e θ T l x i

$P_k(x_i)=\frac{e^{\theta_k^Tx_i}}{\sum_{l=1}^K e^{\theta_l^Tx_i}}$
对似然函数取负对数，求匀值，引入正则项，得到目标函数/损失函数，如下:

J (θ) = - 1 N \sum i \sum k (I (y (i) = k) ln e θ T k x i \sum K l = 1 e θ T l x i) + λ 2 ∥ θ ∥ 22

$J(\theta)=-\frac{1}{N}\sum_i \sum_k \left( {I(y^{(i)}=k)}\ln \frac{e^{\theta_k^Tx_i}}{\sum_{l=1}^K e^{\theta_l^Tx_i}} \right) +\frac{\lambda}{2} \|\theta\|_2^2$
这与网站上的一致，当然也是正确的。接下来是求导，如下：

\partial J ( θ ) \partial θ j = - 1 N

最低0.47元/天解锁文章

关注

5
点赞
踩
5

收藏

觉得还不错? 一键收藏
9
评论
softmax回归，你会求导吗？

softmax回归
复制链接

扫一扫

专栏目录

DLlite CSDN认证博客专家 CSDN认证企业博客

码龄15年

1: 原创

58万+: 周排名

52万+: 总排名

9147: 访问

: 等级

113: 积分

4: 粉丝

5: 获赞

9: 评论

2: 收藏

私信

关注

热门文章

softmax回归，你会求导吗？ 9148

分类专栏

机器学习 1篇

最新评论

softmax回归，你会求导吗？
荀迎曙: 博主，你的变换可以从直观上帮助理解，但是从严格的数学推导角度看是错的我今天研究了一天，最后在 quora 上找到了正解 https://www.quora.com/In-softmax-regression-how-can-one-derive-the-derivative-of-a-loss-function。
softmax回归，你会求导吗？
ssdut_209: 引用「楼主的第一个J求偏导时，楼主只考虑了 I( y(i) = j) 时J(θ)对θ j的导数。没有考虑I...」赞同！
softmax回归，你会求导吗？
ssdut_209: 第一个求导是错的
softmax回归，你会求导吗？
ellia_ellia 回复 ellia_ellia: 直接使用文中的第一个J(θ)（不变形前）对θ j求导有点麻烦，但是推导结果是一样子的。感谢楼主释疑解惑的博文。
softmax回归，你会求导吗？
ellia_ellia: 楼主的第一个J求偏导时，楼主只考虑了 I( y(i) = j) 时J(θ)对θ j的导数。没有考虑I( y(i)≠ j) 时，依然需要求J(θ)对θ j的导数。因为softmax的函数定义的分母项是归一化项，无论I( y(i) = j) 还是I( y(i)≠ j) ，都会有θ j参数的作用。

最新文章

目录

评论 9

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。