neural network

最新推荐文章于 2023-05-26 14:56:50 发布

龙仔941

最新推荐文章于 2023-05-26 14:56:50 发布

阅读量292

点赞数

分类专栏：数学 NLP

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_34146899/article/details/104469060

版权

NLP 同时被 2 个专栏收录

27 篇文章 0 订阅

订阅专栏

26 篇文章 0 订阅

订阅专栏

1.self-attention

理解：最终是要输出，假设按照输入长度输出，就要在每个位置有对所有输入有个softmax-weigth的累加。

softmax-weight 来自于输入embedding 做k，输入embedding做v，矩阵转置相乘得到一个相同尺寸的矩阵，含义是每个位置上，所有位置对此位置的权重值，sofamax后即得到0-1之间的权重值w。然后讲原始embdding作为v，w*v即可得到输出。

2.topk-pooling

对pooling以后的值根据值大小取topk组合成新矩阵，相当于在某一维度降维操作

3.中长文本分类， encode+pooling+fcl-layer认为是个基线操作

优化方面：加入 word-encode char-encode , pooling层做 concat(topk-pooling，attention),

4.深层神经网络，多达5+层，resnet，防止梯度消失；

网络结构内部参数值可视化，发现是否已经梯度消失；

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。