深度学习笔记三：Softmax Regression

最新推荐文章于 2024-02-08 21:27:57 发布

CH-Yuan

最新推荐文章于 2024-02-08 21:27:57 发布

阅读量1.3k

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yuanchheneducn/article/details/46474057

版权

机器学习专栏收录该内容

26 篇文章 0 订阅

订阅专栏

Softmax回归模型

整体理解

回归与分类

借用网上一个帖子的回复：分类问题和回归问题都要根据训练样本找到一个实值函数g(x). 回归问题的要求是：给定一个新的模式，根据训练集推断它所对应的输出y（实数）是多少。也就是使用y=g(x)来推断任一输入x所对应的输出值。分类问题是：给定一个新的模式，根据训练集推断它所对应的类别（如：+1，-1）。也就是使用y=sign(g(x))来推断任一输入x所对应的类别。综上，回归问题和分类问题的本质一样，不同仅在于他们的输出的取值范围不同。分类问题中，输出只允许取两个值；而在回归问题中，输出可取任意实数。

Softmax回归

是一个分类器，从多个类中选择一个，哪一个类别的概率高就选择哪个类。longistic回归是从两个类中选择一个，用sigmoid函数或tanh函数映射到对应的类。
关键问题是代价函数，目的是使代价函数的值最小。既然是分类问题，训练的时候的代价函数就要以分错的多少作为代价函数。于是，softmax的代价函数：
这里写图片描述
对参数求导：

对参数的求导，自己计算的不对，在@晓辉@永恒的电波（deep learning高质量）的帮助下，总算理解了。把他们写的图直接上了。
这里写图片描述
总和：对于和式的求导，要把式子拆开再求导，我自己相当于只求了其中的一部分。

与稀疏自编码的比较

目的不同：稀疏自编码的目的是为了压缩表示，而softmax regression 是为了分类。
训练方式不同：稀疏自编码是无监督的，而softmax regression是监督的。
结构不同：稀疏自编码是一个输入层、一个隐藏层，还有一个输出层——编码和解码；而Softmax只有两层，一层是输入，一层是输出。
参数：本质是一样的，就是层间的联系。但是表示形式不同，稀疏自编码用的是[w1,b1,w2,b2]，而softmax是theta，其实就是[w1,b1].

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
深度学习笔记三：Softmax Regression

Softmax回归模型整体理解回归与分类借用网上一个帖子的回复：分类问题和回归问题都要根据训练样本找到一个实值函数g(x). 回归问题的要求是：给定一个新的模式，根据训练集推断它所对应的输出y（实数）是多少。也就是使用y=g(x)来推断任一输入x所对应的输出值。分类问题是：给定一个新的模式，根据训练集推断它所对应的类别（如：+1，-1）。也就是使用y=sign(g(x))来推断任一输入x所对应的类别
复制链接

扫一扫

专栏目录

CH-Yuan CSDN认证博客专家 CSDN认证企业博客

码龄11年

94: 原创

24万+: 周排名

107万+: 总排名

58万+: 访问

: 等级

5360: 积分

74: 粉丝

102: 获赞

71: 评论

232: 收藏

私信

关注

热门文章

分类专栏

最新评论

libboost_filesystem.so: undefined reference to
你与_晚风: target_link_libraries（加上opencv_xphoto boost_system）
Self-Tuning Spectral Clustering论文阅读和代码理解
开心大男孩XGL: 求该篇论文的源码，官方链接已经失效了。
Self-Tuning Spectral Clustering论文阅读和代码理解
开心大男孩XGL: 您好，您找到这篇论文的源码了吗？可以分享一下吗？
/lib64/libc.so.6 is not a symbolic link 解决方法
风凉斋: 为啥呢
在matlab中如何使用SVM工具箱
m0_51726145: 字段赋值赋给非结构体数组对象。出错 createOptionFeedback (line 33) options.(stopTestOptions{k}) = []; 出错 prepareOptionsForSolver (line 57) optionFeedback = createOptionFeedback(options); 出错 quadprog (line 134) [options, optionFeedback] = prepareOptionsForSolver(options, 'quadprog'); 出错 svc (line 60) [alpha lambda how] = quadprog(H, c, A, b, [], [], vlb, vub, x0, neqcstr);

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。