《神经网络与深度学习》第八章学习笔记

8.1、注意力机制

1、大脑中的信息超载问题:人脑每个时刻接收的外界输入信息非常多,包括来源于视觉、听觉、触觉的各种各样的信息。

2、两种注意力

自下而上:汇聚(pooling)

自上而下:会聚(focus)

8.2、人工神经网络中的注意力机制

1、软性注意力机制

2、注意力打分函数

3、注意力机制的变体

硬性注意力

键值对注意力

多头注意力

结构化注意力

指针网络

8.3、注意力机制的应用

1、文本分类

2、机器翻译

3、Image Caption

4、阅读理解

8.4、自注意力模型

1、变长序列的建模

当使用神经网络来处理一个变长的向量序列时,我们通常可以使用卷积网络或循环网络来进行编码来得到一个相同长度的输出向量序列。卷积网络和双向循环网络只建模了输入信息的局部依赖关系。全连接模型无法处理变长问题。

2、自注意力

自己attention自己

3、QKV模式

3、多头自注意力模型

8.5、Transformer

1、

2、复杂度分析

Transformer缺点:没法处理太长的文档

3、

8.6、外部记忆

1、大脑中的记忆

记忆:外界信息在人脑中的内部表示

记忆过程:工作记忆(短期记忆),情景记忆,结构记忆(长期记忆)

特点:联想记忆

2、类比

3、记忆网络

记忆增强神经网络

8.7、结构化的外部记忆

1、

2、神经图灵机

图灵机:一种抽象数学模型,可以用来模拟任何可计算问题。

组成:

神经图灵机:把图灵机的每个部件用神经网络来替代,从而使得整个图灵机的架构是可微分的。

3、小结

8.8、基于神经动力学的联想记忆

1、联想记忆:自联想;异联想。

2、神经网络如何学习

3、Hopfield网络

在Hopfield网络中,我们给每个不同的网络状态定义一个标量属性,称为“能量”。

Hopfield网络是稳定的,即能量函数经过多次迭代后会达到收敛状态。

检索过程:给定一个外部输入,网络进过演化,会达到某个稳定状态。

4、使用联想记忆增肌网络容量

既然联想记忆具有存储和检索功能,我们可以利用联想记忆来增加网络容量。

和结构化的外部记忆相比,联想记忆具有更好的生物学解释性。

8.9、总结

1、由于优化算法和计算能力的限制,神经网络在实践中很难达到通用近似的能力。(网络不能太复杂,参数不能太多)

2、

  • 9
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
在《python深度学习》的第八章中,主要讨论了在ImageNet大规模视觉识别挑战(ILSVRC)上训练深度神经网络的主题。其中最后一章讨论了SqueezeNet深度学习架构[1]。SqueezeNet是在2016年的一篇论文中提出的,它在准确度上和AlexNet相当,但参数减少了50倍,模型大小小于0.5MB。 在这一章中,还提到了一个名为test_alexnet.py的脚本,用以测试在ImageNet上训练的CNN模型。这个脚本没有进行任何修改,因为该章节中的test_*.py脚本旨在成为可以应用于任何在ImageNet上训练的CNN模型的模板。 此外,这一章还介绍了处理问题的一种方法,即使用softmax温度。在使用softmax温度时,需要尝试多种不同的温度值,以找到合适的温度值。 总结起来,《python深度学习》第八章主要涵盖了SqueezeNet深度学习架构、在ImageNet上训练的CNN模型的测试脚本以及使用softmax温度来处理问题的方法。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* [Python视觉深度学习系列教程 第三卷 第8章 在ImageNet上训练SqueezeNet](https://blog.csdn.net/bashendixie5/article/details/122175562)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *3* [《python深度学习学习笔记与代码实现(第八章:8.1,8.2,8.3)](https://blog.csdn.net/qq_41718518/article/details/90216766)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值