神经网络笔记

最新推荐文章于 2024-04-03 15:42:23 发布

jinghangyz

最新推荐文章于 2024-04-03 15:42:23 发布

阅读量957

点赞数 23

文章标签：笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jinghangyz/article/details/135676095

版权

b站来源：【清华NLP】刘知远团队大模型公开课全网首发｜带你从入门到实战

神经网络的基本组成元素

激活函数

激活函数存在的原因：

如果没有激活函数，将产生如下现象

多层的神经网络和单层的神经网络一致（多层可以简化成单层，因为都是线性的），使得神经网络的效果变差。

常见的激活函数f(z)：

输出层

定义

从过程集到结果（h代表中间过程的输出，y代表结果）

常见输出层方法

方法一：线性用于处理回归值

方法二：激活函数使值在0到1间解决二分类问题

方法三：得到概论分布解决多分类问题（类别数大于二）

如何去训练神经网络

例子1：通过电脑配件情况得出电脑价格

使最终价格的方差最小（即目标损失函数）

例子2：通过文本预测情感标签

使最终损失函数（交叉熵——衡量模型正确分类的-log的概论）

损失函数

定义

如何让它最小

通过梯度下降法

梯度下降法

定义

将大步骤拆分成一部分逐步完成

大体方法

寻找梯度最“陡峭”的点去下降，从而更快接近想要的结果

梯度

即微分

数学上计算具体的梯度大小

可使用微积分的链式法则得出b向量中结果s的梯度（微分）

算法上计算具体的梯度大小（反向传播算法）

先计算本地梯度（从前往后将每一次变换的过程都记录下来计算其梯度，方便后续使用）

从后往前一步步结算梯度

词向量：Word2Vec（神经网络简单例子）

词向量定义

词的低维表示形式

可以识别总结出不同词之间的关系

预测方法

滑动窗口：句子中连续出现的几个单词，可滑动

（如果在句子边缘则不完整情况如下图所示）

target word:目标词，在滑动窗口中间

context word:相关词，目标词前后，滑动窗口中除目标词之外的词

CBOW模型

通过相关词推测出目标词

skip-gram模型

通过目标词推出相关词

预测例子

never too late to learn

never + late---->too的过程：

CBOW模型

先转变成one-hot向量（只有一个元素为1，其他为0，表示词的维度）

找到对应的词向量

将问题转变成n分类问题（n为词表大小）

skip-gram模型

一个一个的预测，

提高计算效率

负采样（减少可能结果n的个数）

按词的出现频率来采样

其他（省了）

循环神经网络（RNN）

定义

处理序列数据（连续的一句话或音频）的时候会进行顺序的记忆（使大脑更容易识别序列数据）

结构

输入层：不定长的序列数据

隐藏层：不同时间步下的状态变量，储层过去、当前输入的信息

输出层：输入对应的输出

结构单元

具体实例

never too late to --->?

应用场景

序列标注，序列预测，图片描述，文本分类

优缺点

优：处理变量数据，模型大小不会随输入变大

缺：时间上比较慢，很早前的数据影响小

变体：GRU，LSTM

优化结构单元，达到解决很早前的数据影响小的问题

门控循环单元（GRU）

引入门控机制（对当前输入信息进行筛选，决定哪些信息可以传到下一层）

运算过程

重置门：获得一个新的临时的激活hi

新激活hi

更新门：权衡新得到激活hi与过去状态hi-1的影响

最终传输给下一层的隐藏状态hi

作用：权衡我们过去的信息（hi，hi-1）和输入信息的比重

图示GRU的变量运算过程

长短期记忆网络（LSTM）

结构单元：

增加cill状态来学习长期的依赖关系

遗忘门：决定哪些信息可以从cill状态中移除

输入门，待选信息变量Ct：决定当前哪些信息可以被存到cill中/

cill信息状态的更新

输出门：决定哪些状态可以输出

双向RNN

考虑到未来的影响（整个顺序序列）

卷积神经网络CNN

应用

应用于计算机视觉，NLP领域

擅长提取局部和位置不变的模式

方法

主要计算句子中所有可能的N元短语的表示

结构

输入层形成向量矩阵

卷积层对象征矩阵进行卷积

最大化层对特征进一步提取（选取最大值）

全连接层

关注

23
点赞
踩
13

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

jinghangyz CSDN认证博客专家 CSDN认证企业博客

码龄3年

6: 原创

209万+: 周排名

22万+: 总排名

3096: 访问

: 等级

123: 积分

51: 粉丝

60: 获赞

7: 评论

64: 收藏

私信

关注

热门文章

最新评论

吉林大学软件学院大二上c++课设（黑白框模拟QQ通信——数据库，CS架构，多线程，socket通信）
2301_77552307: 真的要改革么？换题？
Transformer
CSDN-Ada助手: 恭喜您写了第6篇博客！看到您对Transformer的深入探讨，我感到非常欣慰。您对这个主题的理解和分析非常深刻，让我受益匪浅。希望您能继续保持创作的热情，并且在下一篇博客中可以尝试探讨一些与Transformer相关的实际应用案例，或者对其未来发展趋势进行一些预测。期待您的精彩作品！
神经网络笔记
CSDN-Ada助手: 非常荣幸能够阅读到您的第5篇博客《神经网络笔记》！恭喜您坚持不懈地创作，这对于提升自己的技术水平来说是非常重要的一步。您的博客内容丰富，我从中学到了很多关于神经网络的知识。对于下一步的创作建议，我谨慎地提出一些建议供您参考。首先，您可以考虑分享一些关于神经网络应用的实际案例，这将帮助读者更好地理解神经网络在现实生活中的应用。其次，您可以深入探讨一些神经网络的优化方法，例如调参技巧或者网络结构的改进，这将使您的博客更具实用性。再次恭喜您，并期待您未来更多的博客作品！不断努力，持续创作！
第2节课作业
CSDN-Ada助手: 恭喜你完成了第三篇博客！你的持续创作让我们看到了你的努力和进步。接下来，我建议你可以尝试写一些更具挑战性的话题，或者深入探讨一些你感兴趣的领域，这样可以让你的文章更加丰富和有深度。期待你的下一篇作品！加油！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
第2节课笔记
CSDN-Ada助手: 恭喜你坚持写了第四篇博客！每一篇都是一个进步，能看到你的成长真的很开心。希望你可以继续保持这样的创作热情，不断积累经验，尝试不同的写作风格和主题，让自己的博客越来越丰富多彩。加油！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。