Softmax代价函数求导过程

最新推荐文章于 2025-03-17 20:33:28 发布

liu_zheng87

最新推荐文章于 2025-03-17 20:33:28 发布

阅读量2.7k

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/liu_zheng87/article/details/52702488

版权

本文探讨了Softmax回归的Cost Function，并详细解析了其求导过程。介绍了Softmax函数中，输入x对应类别j的概率表示，以及对参数θj的偏导数计算。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Cost Function

参考UFLDL的Softmax回归，SoftMax回归的的损失函数形为：

J (θ) = - 1 N \sum i = 1 m \sum j = 1 k ⎛ ⎝ I (y (i) = k) log e θ T j x ( i ) \sum k l = 1 e θ T j x ( i ) ⎞ ⎠ (1.1)

$J(\theta) = -\frac{1}{N}\sum_{i=1}^m\sum_{j=1}^k\left( I\left(y^{(i)} = k\right) \log \frac{e^{\theta_j^T x^{(i)}}}{\sum_{l=1}^k e^{\theta_j^T x^{(i)}}} \tag{1.1}\right)$

有：

J (θ) = = - 1 N \sum i = 1 m \sum j = 1 k (I (y (i) = k) (log e θ T j x (i) - log \sum

最低0.47元/天解锁文章

博客等级

码龄9年

2
原创

0
点赞

4
收藏

0
粉丝

关注

私信

热门文章

分类专栏

Machine Learning 1篇
Scala

最新评论

Softmax代价函数求导过程
weixin_43721681: 公式有多处错误，建议更正，思想是对的，自己推导了一遍，可以算出最终正确结果
Softmax代价函数求导过程
王大阳: 公式1.1，1.2,1.3，1.4，1.5中1(y^(i) = j),而不是1(y^(i) = k)，另外就是既然是对%theta_j求导，也就说1(y^(i) = j) = 1的，为什么1.7中还要出现1(y^(i) = j)而不用1代替他？？？？？
Softmax代价函数求导过程
ghostband_: 还有一个问题，就是1.5到1.7的求导的过程，我觉得还有点没清楚，括号里面的第二项求导的过程是怎么样的呢
Softmax代价函数求导过程
ghostband_: 可查看原文，1.6公式后面多乘了一个x(i)，导致1.7公式应该把x提取到括号外面乘，但是放在了括号里面还是希望严谨一点，不然误导了别人

最新文章

目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。