NLP 总结

最新推荐文章于 2022-04-11 21:06:52 发布

curry dog

最新推荐文章于 2022-04-11 21:06:52 发布

阅读量182

点赞数

分类专栏：面试深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39849839/article/details/109390458

版权

面试同时被 2 个专栏收录

23 篇文章 0 订阅

订阅专栏

9 篇文章 0 订阅

订阅专栏

LSTM（长短期记忆网络）是一种递归神经网络，通过遗忘门、输入门和输出门来处理长期依赖问题。遗忘门决定哪些历史信息应该被遗忘，输入门控制新信息的融合，输出门则决定当前的输出如何基于记忆单元。激活函数通常使用sigmoid确保门控效果。LSTM结合CRF（条件随机场）用于寻找最佳路径，从局部最优到全局最优，以实现更优的序列标注任务。

摘要由CSDN通过智能技术生成

LSTM

三个门控制对前一段信息、输入信息以及输出信息的记忆状态，进而保证网络可以更好地学习到长距离依赖关系。

遗忘门（记忆门）：通过判断当前输入信息的重要程度决定对过去信息的保留度
输入门：通过判断当前输入信息的重要程度决定对输入信息的保留度
输出门：当前输出有多大程度取决于当前记忆单元

激活函数：

门：sigmoid，0-1分布概率，符合门控的定义。且当输入较大或者较小时，值会接近1或0，进而控制开关。
候选记忆：分布在-1~1之间，与大多场景下0中心分布吻合在输入为0有较大的梯度，使模型更快收敛

LSTM+CRF
在这里插入图片描述
找最优路径时，要从局部最优到全局最优，保存每个节点对应的得分最高的路径及其分数。最后一个时刻得分最高的节点对应的路径就是最优路径。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

curry dog CSDN认证博客专家 CSDN认证企业博客

码龄7年

126: 原创

6万+: 周排名

25万+: 总排名

12万+: 访问

: 等级

1640: 积分

26: 粉丝

77: 获赞

48: 评论

238: 收藏

私信

关注

热门文章

分类专栏

面试 23篇
go 3篇
数据库和分布式 6篇
写作 1篇
c++ 31篇
LINUX 36篇
深度学习 9篇
3D视觉 5篇
视觉 14篇
CUDA 5篇
JAVA 1篇
计算机基础 5篇
writing 2篇
代码管理 1篇
QT 29篇
ros 2篇
python 7篇
openGL 5篇
相机 2篇

最新评论

CNN原理总结
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)提升标题与正文的相关性。
open3d 和numpy 交互
锋利成: 麻烦问一下，点云得xyz报警，需要怎么定义这个数组呢
makefile 学习
CSDN-Ada助手: 乾坤未定，你我皆是黑马。
C++ 语法杂记
CSDN-Ada助手: C语言中可以使用哪些库函数？
QGraphicsItem拖动+缩放+实时更新pixmap
拎只菜鸟: 您好，请问有源码能学习一下吗？非常感谢

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。