邱锡鹏神经网络与深度学习课程【十一】——网络优化与正则化3和注意力机制和外部记忆1

最新推荐文章于 2024-04-24 12:05:29 发布

桐原因

最新推荐文章于 2024-04-24 12:05:29 发布

阅读量497

点赞数

分类专栏：邱锡鹏神经网络与深度学习文章标签：神经网络机器学习人工智能深度学习 nlp

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36287702/article/details/108820834

版权

邱锡鹏神经网络与深度学习专栏收录该内容

18 篇文章 13 订阅

订阅专栏

正则化

思考泛化性：重新思考模型复杂度和泛化之间的关系

所有损害优化的方法都是正则化

正则化方法：

δ1和δ2的正则化

提前停止：

权重衰减：

丢弃法：Dropout

Dropout意义：

循环神经网络上的丢弃法：要丢都丢

数据增强：

标签平滑：

总结：

注意力机制和外部记忆1

网络能力

注意力机制：

例子：阅读理解传统RNN会出问题：1.长程依赖问题2.模型容量问题

通用近似定理

大脑中的注意力：

如何实现？

人工神经网络中的注意力机制

注意力模型：软性注意力机制 soft attention mechanism

注意力打分函数：双线性模型带方向但是缩放点击模型不带方向

一些常见的注意力

注意力模型：文本分类

机器翻译：

image caption

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。