DL Softmax，多层感知机，卷积【0】

爱喝热水的呀哈喽

已于 2024-04-17 23:37:33 修改

阅读量435

点赞数 4

文章标签：机器学习算法人工智能

于 2024-04-16 23:54:26 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_68339197/article/details/137842747

版权

学习笔记

Softmax

一个样本，4个特征，3个类别，o=Wx+b

o=(o1,o2,o3)，表示三个类别预测分值

softmax函数能够将未规范化的预测变换为非负数并且总和为1，同时让模型保持可导的性质

选择最大的呢个yj

对小批量样本的数据执行矢量计算 O=WX+b，b广播。

损失函数、极大似然？交叉熵

不戴帽子的yj是独热编码，第j个分量为1，其余为0，表示属于第j类（或者：真实的概率分布）

戴帽子的是预测的概率值

导出交叉熵：

之后就直接用啦

附：熵的定义

极大似然估计

通俗地讲：

事件A的发生与参数θ有关，将事件A发生的概率用θ表示，则P(A|θ)的极大值点就是θ的极大似然估计值。

小结

softmax运算获取一个向量并将其映射为概率。
softmax回归适用于分类问题，它使用了softmax运算中输出类别的概率分布。
交叉熵是一个衡量两个概率分布之间差异的很好的度量，它测量给定模型编码数据所需的比特数。

多层感知机

softmax后，我们来看多层感知机。

其实就是一层线性不够啦。……在此表示的基础上建立一个线性模型可能会是合适的，但我们不知道如何手动计算这么一种表示。对于深度神经网络，我们使用观测数据来联合学习隐藏层表示和应用于该表示的线性预测器。

加了个隐藏层。

不能都是线性，要加个激活函数：

必要时，可以多加几层。

而且，虽然一个单隐层网络能学习任何函数，但并不意味着我们应该尝试使用单隐藏层网络来解决所有问题。事实上，通过使用更深（而不是更广）的网络，我们可以更容易地逼近许多函数。

CNN（卷积神经网络）

MOTIVATION:全连接太复杂了。

Do we really need “fully connected” in image processing？

爱喝热水的呀哈喽

关注

4
点赞
踩
7

收藏

觉得还不错? 一键收藏
1
评论
DL Softmax，多层感知机，卷积【0】

通俗地讲：事件A的发生与参数θ有关，将事件A发生的概率用θ表示，则P(A|θ)的极大值点就是θ的极大似然估计值。
复制链接

扫一扫

爱喝热水的呀哈喽 CSDN认证博客专家 CSDN认证企业博客

码龄2年

96: 原创

1万+: 周排名

1万+: 总排名

3万+: 访问

: 等级

1617: 积分

531: 粉丝

654: 获赞

15: 评论

379: 收藏

私信

关注

热门文章

最新评论

二叉树【2.5】代码专项
爱喝热水的呀哈喽: #include <iostream> #include <vector> using namespace std; struct TreeNode { int val; TreeNode *left; TreeNode *right; TreeNode(int x) : val(x), left(nullptr), right(nullptr) {} }; vector<int> findPathToRoot(TreeNode* root, int target) { vector<int> path; bool found = false; // 辅助函数，用于递归地查找路径 function<void(TreeNode*, vector<int>&)> dfs = [&](TreeNode* node, vector<int>& currentPath) { if (!node) return; currentPath.push_back(node->val); // 假设这是“访问节点”的模拟（但实际上是前序遍历的访问时机） // 递归地查找左子树和右子树 dfs(node->left, currentPath); dfs(node->right, currentPath); // 如果当前节点是目标节点，则复制并返回路径（注意：这里并不符合后序遍历的时机） if (node->val == target) { found = true; path = currentPath; // 注意：这里直接赋值可能导致问题，因为currentPath之后会被修改 // 更安全的做法是使用一个临时变量来保存副本，或者在这里不直接返回，而是在外层检查found } if (!currentPath.empty() && currentPath.back() == node->val) { currentPath.pop_back(); // 回溯，移除当前节点（模拟后序遍历的“根”节点访问时机） } }; dfs(root, path); // 如果找到了目标，反转路径以匹配从根到目标的顺序 if (found) { reverse(path.begin(), path.end()); } // 如果没有找到目标，或者你想在没找到时返回一个空路径，可以添加相应的处理 return path; } // 注意：上面的代码在找到目标后立即返回整个路径的副本并不是最高效的方法， // 因为它在每次递归时都复制了整个路径。更高效的方法是使用一个全局变量来存储路径， // 或者在找到目标时停止递归并构建路径。 int main() { // 构建一棵树 TreeNode* root = new TreeNode(1); root->left = new TreeNode(2); root->right = new TreeNode(3); root->left->left = new TreeNode(4); root->left->right = new TreeNode(5); // 查找值为5的节点到根节点的路径 int target = 5; vector<int> path = findPathToRoot(root, target); if (!path.empty()) { cout << "Path from root to target: "; for (int val : path) { cout << val << " "; } cout << endl; } else { cout << "Target not found." << endl; } // 清理分配的内存（在实际应用中很重要） // ...（此处省略了清理代码以保持示例简洁） return 0; }
c++/c输出double问题
爱喝热水的呀哈喽: 我知道了，int不能用double输出，反之亦然
codeup
爱喝热水的呀哈喽: 【一些推荐的PAT甲级刷题网址】https://minipro.baidu.com/ma/qrcode/parser?app_key=fjESu3W8LB8fsE3tG3xUoMXSvvDjawbn&launchid=08079473-351d-4d9c-a567-aaa2bb36c4ab&path=%2Fpages%2Fnote%2Findex%3Fslug%3De9ed322b0473%26origin%3Dshare%26_swebFromHost%3Dbaiduboxapp
注意力评分函数
CSDN-Ada助手: 恭喜你撰写了第20篇博客“注意力评分函数”！你对这个主题的深入探讨让人印象深刻。希望你能继续保持创作的热情和耐心，不断挖掘更多有趣的话题。或许下一步可以考虑探讨如何优化注意力评分函数的算法，或者结合实际案例进行分析，丰富你的内容。期待你的下一篇作品！
注意力机制【1】
CSDN-Ada助手: 恭喜您发布了第16篇博客，“注意力机制【1】”！持续创作不易，您的坚持和努力可嘉。在这篇博客中，您对注意力机制进行了深入探讨，展现了您的专业知识和研究能力。接下来，我期待看到您在下一篇博客中继续分享更多关于注意力机制的知识，并且希望您能加入一些实例或案例，让读者更容易理解和吸收。继续保持创作的热情和努力，加油！

最新文章

2024

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。