Softmax回归

最新推荐文章于 2024-07-24 17:01:51 发布

智元说车

最新推荐文章于 2024-07-24 17:01:51 发布

阅读量440

点赞数 1

分类专栏：机器学习文章标签：回归机器学习算法统计学

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012771351/article/details/53167816

版权

机器学习专栏收录该内容

35 篇文章 4 订阅

订阅专栏

注：本文中所有公式和思路来自于Andrew NG先生的《cs229-notes1》，我只是为了加深记忆和理解写的本文。

本来线性回归不打算说Softmax回归，因为套用Logistic回归的那一套思路基本没有任何难度，昨晚翻了翻Andrew NG的machine learning的讲义，觉得说得挺实在也挺简单，原版为英文版，如果大家看起来不方便，这里不妨和大家分享一下。

Logistic是解决二分类问题的，而Softmax是解决多分类的方法，Softmax和Logistic一样都是指数簇分布，是对数线性模型，广义上的线性回归。

既然是多分类，y∈{1, 2,3 ...k}，用Φ1、Φ2、Φ3...Φk表示样本属于该类别的概率，既然是概率，那么加和就为1：

为了方便起见，我们去掉Φk：

接下来定义T(y)∈R：

我们定义一个规则：

对于这个规则，我们举个例子说明一下：

我们将这个规则与T(y)联系起来：

对T(y)求期望即使概率：

我们求一下联合概率：

虽然看起来有些乱，但是请耐住性子，都是很简单的变换而已，其中最后一步，我们令：

我们将其中的η改写成通项：

为了方便起见，我们令：

整理下所有关于Φ的公式：

代换公式，可以新的等式：

根据在Logistic中的假设，我们可以知道η与x是线性相关的，所以可以得到：

为了记号方便，我们做一个对于第k类的假定：

最终我们得到最终的概率公式：

那么最终的分类过程其实是这样的：

其实计算的是一个样本属于每个分类的概率，我们取一下对数似然：：

最后我们可以用Logistic最后的那一套去优化这个θ，什么BGD、SGD、mini-batch都是可以的，也可以用牛顿法等等，就不详细说了。

到此Softmax就介绍到这里，欢迎批评指正！

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

智元说车 CSDN认证博客专家 CSDN认证企业博客

码龄11年

34: 原创

24万+: 周排名

83万+: 总排名

12万+: 访问

: 等级

1653: 积分

64: 粉丝

67: 获赞

7: 评论

119: 收藏

私信

关注

热门文章

分类专栏

机器学习 35篇
linux 2篇
deep learning 1篇

最新评论

HMM之前向后向算法
weixin_46083434: 你好，非常感谢你的讲解让我可以把前向算法和后向算法结合起来理解，不过还有两个问题不是很明白，1. 单个状态的概率那个公式，分母P(o|lamda) 换成alphat(i)*betat(i)再对所有i（状态）求和，是因为生成观测序列o的总概率是t时刻下每个i（状态）可能的概率之和吗？ 2. 最后那个联合概率转换到最终结果不太明白，请问可以请教一下再具体一点的步骤吗？谢谢
LDA-隐狄利克雷分布-主题模型
leilei9406: 想请问下如果做短文拼接可以有哪些方法，我正在做一个短文本的LDA结果不是很好，可以请教下您吗？
变分算法
qq_36711371: 请问一下，P（x）和q（x）的距离公式中，α=1的时候，公式为什么会退化为KL(p||q)，α=1时，分母为0.
HMM之前向后向算法
Chester_ieee: 前后向概率的公式，i和t好像是写反了。
聚类之层次聚类与密度聚类
落入凡间的奥特曼: 你好，请问这个机器学习升级版是课程吗?

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。