机器学习学习笔记（10）----softmax回归

最新推荐文章于 2024-07-24 17:01:51 发布

swordmanwk

最新推荐文章于 2024-07-24 17:01:51 发布

阅读量295

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/swordmanwk/article/details/106600383

版权

机器学习专栏收录该内容

20 篇文章 7 订阅

订阅专栏

logistic回归解决的是二元分类问题，对于多元分类问题，需要通过softmax回归模型来解决。回顾一下logistic模型(《机器学习学习笔记（8）----logistic回归模型》)，假设事件A发生的概率是p，那么：

p=1/(1+exp(-wTx)) (1)

其中：wT=（w0 w1 ..... wn)，x=（x0 x1 ...... xn）T，x0=1，T表示矩阵的转置。

如果对（1）式右边的分数表达式的分子和分母都乘以一个exp(w1Tx)，得：

p=exp(w1Tx)/(exp(w1Tx)+exp(w2Tx)) (2)

那么对于A事件不发生的概率：

1-p=exp(w2Tx)/(exp(w1Tx)+exp(w2Tx)) (3)

这样，对于多元分类问题，假设有K个分类，那么第k个事件发生的概率，可以写成：

（4）

接下来，我们用y=k表示第k个事件发生，那么

P(y=k|x)= Pk =hk(x) (5)

假设我们的训练集有m个样例，那么第i个样例的条件概率可以表示成：

(6)

I(y(i)=j)被称为指示函数。可以看出，当y(i)=k时，公式（6）简化成公式（5）。

与logistic回归相似，我们假设训练集中的各个样本都是相互独立的，那么这些样本对于y=y（i）同时出现的联合概率：

（7）

问题转换成L(w)的最大值，对（7）式两端取对数：

(8)

类似logistic回归模型，可以定义损失函数：

J(w) = -(1/m)l(w) (9)

把(8)代入到(9)式，得到softmax的损失函数的公式：

（10）

对于损失函数求最小值和对数似然函数求出最大值实际上是等价的，后面的工作就是求J(w)的梯度了。

(11)

同样，这个损失函数的最小值没有解析解。

因此我们需要用批量梯度下降优化方法通过每次把所有的样本作为输入，通过迭代计算来获得最优的wr参数。

对于随机梯度下降优化方法，可以抽取公式(11)的i=k时的值，得梯度公式：

（12）

参考资料：

《Python机器学习算法：原理，实现与案例》

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

swordmanwk CSDN认证博客专家 CSDN认证企业博客

码龄16年

112: 原创

4万+: 周排名

88万+: 总排名

47万+: 访问

: 等级

5362: 积分

125: 粉丝

74: 获赞

36: 评论

235: 收藏

私信

关注

热门文章

分类专栏

机器学习 20篇
ACE 4篇
C/C++技术 20篇
oracle 23篇
书评 4篇
其他 1篇
算法 24篇
设计模式 4篇
多核编程 2篇
Linux 47篇

最新评论

32位汇编语言学习笔记(6)--设置条件码
Innocence24: 条件码可以手动修改吗？
从B树中删除关键字
javamoke: 作者好，疑惑的点是关于 B-TREE-DELETE-NONONE (x, k) 的代码中，行 4~10 以及行 12 ~ 42 是都放在一个 while 中吗？看起来像是被各自的一个while 包裹了，这样的话，还没真正找到 k 关键字附近时，就已经做了好多处理了。麻烦作者重新贴下带缩进格式的代码。
从B树中删除关键字
javamoke: 十年前的文章，看的挺好的。get到了。感谢。
从B树中删除关键字
javamoke: 是，合并两个子结点时，隔离两个子结点的关键字必须是中间的。i-1 位置上的关键字才是在 p，y 的中间。
32位汇编语言学习笔记(3)--leal和算术运算指令
swordmanwk: $16就是指数字16，和后面%eax+%edx*4的地址中的结果相乘，再刷新到 %eax+%edx*4的地址中。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。