NLP - seq2seq

最新推荐文章于 2024-06-20 10:46:54 发布

小田_

最新推荐文章于 2024-06-20 10:46:54 发布

阅读量151

点赞数

分类专栏： NLP

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45390999/article/details/115437759

版权

NLP 专栏收录该内容

26 篇文章 5 订阅

订阅专栏

文章目录

seq2seq：Sequence to sequence
也称为序列网络模型

应用

机器翻译
谷歌翻译做的比较好。还会做目标语言检测。
文本摘要
情感对话生成
代码补全

结构

包含两个循环神经网络，它们共同工作从而将一个序列转化为另一个序列：

编码器网络：将输入压缩成矢量；
解码器网络：将该矢量展开成新的序列。

在这里插入图片描述

如同截获一封电报，敌方编码，我方解码。

统计模型的问题：没有上下文信息。

RNN 要求输入大小一致。
文本数据长度不同，可以补全。

特殊符
起始符：GO
终止符：EOS （end of sentence）

存在的问题

压缩损失了信息
输入长度有限制，在10–20之间，如果过长，如40–50，表达效果会直线下降。

以上两个问题，引出 attention 机制来解决

Attention

在图片的某个特定领域以高分辨率展示，周边区域使用低分辨率。即注意区域。
将 attention 机制应用在 NLP 领域，取得的效果显著。在 seq2seq 中加上 attention机制。

本质：对 Encoder 层状态进行加权，从而掌握输入语句中的所有细节信息。
加权有不同的算法，不同算法指定的加权方式不同

加权效果：
如果用热度图来说
对于机器翻译，对角线位置最重要。
在这里插入图片描述

每一个词有他们对应的特定的概率分布。可以根据概率来计算，结果的每个词应该聚焦哪几个输入的词。

在这里插入图片描述

Bucket 机制

正常情况要对所有句子进行补全。
Bucker 可以先分组，再计算。

假如有很多组对话，输入输出都可能有 0–100个字符。
可以从 0–100 中取一个区间，对每个区间进行训练。

tf 的 seq2seq 会自动加入 bucket 机制。

https://www.cnblogs.com/HolyShine/p/9850822.html

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
NLP - seq2seq

文章目录结构存在的问题AttentionBucket 机制应用机器翻译谷歌翻译做的比较好。还会做目标语言检测。文本摘要情感对话生成代码补全结构如同截获一封电报，敌方编码，我方解码。统计模型的问题：没有上下文信息。RNN 要求输入大小一致。文本数据长度不同，可以补全。特殊符起始符：GO终止符：EOS （end of sentence）存在的问题压缩损失了信息输入长度有限制，在10–20之间，如果过长，如40–50，表达效果会直线下降。以上两个问题，引
复制链接

扫一扫

专栏目录

小田_ CSDN认证博客专家 CSDN认证企业博客

码龄5年

117: 原创

3万+: 周排名

6万+: 总排名

11万+: 访问

: 等级

1971: 积分

303: 粉丝

197: 获赞

21: 评论

351: 收藏

私信

关注

热门文章

分类专栏

最新评论

hf-mirror 使用
world=hello: 大佬请问一下我在用实验室服务器下载CompVis/stable-diffusion-v1-4模型的时候遇到了这个问题 requests.exceptions.ConnectionError: (MaxRetryError("HTTPSConnectionPool(host='cdn-lfs.hf-mirror.com', port=443) 这该怎么解决呢
wiki 爬虫记录
白话机器学习: 通过文章可以看出，博主很有耐心，技术文章不仅是对技术的坚守，更是对知识的热忱和热爱，感谢您的优质分享和坚持更文。期待着博主更加深入的剖析，为大家带来更多的技术好文。
NLP 实战 - 商品信息可视化与文本分析
Joe_Hall_Lee: Kaggle上有。
NLP 实战 - 商品信息可视化与文本分析
sheshizhang: 大佬求数据集
NLP 实战 - 商品信息可视化与文本分析
Hex酱: 大佬，求求数据集，没有数据集我怎么活啊

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。