NLG过程的优化与项目Inference

最新推荐文章于 2024-08-23 17:48:13 发布

海滩上的那乌克丽丽

最新推荐文章于 2024-08-23 17:48:13 发布

阅读量222

点赞数

分类专栏： NLP自然语言处理深度学习文章标签：机器学习深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/h2728677716/article/details/124676366

版权

深度学习同时被 2 个专栏收录

13 篇文章 2 订阅

订阅专栏

NLP自然语言处理

5 篇文章 0 订阅

订阅专栏

NLG：自然语言生成

我们在做完train训练之后，需要对测试数据集进行测试，也就是NLG的过程。

Greed Search（贪婪Search）：

做法：

我们在训练好模型后，seq2seq的Decoder做预测的过程中，

从<start>的标签开始输入，预测出最大的概率对应的词，作为decoder下一步的输入,

输入后再次预测一个最大概率的词，再将这个词作为下个步骤的输入，

依次循环下去直到，最后输出<end>，代表这句话预测结束。

Greed Search 问题：

这样每次预测最大的概率，只是考虑了局部最优，而对于全局来说不一定是最优的输出，他只考虑了下一个词对应当前词的最大概率，但是对于整个句子来说可能这样每次只考虑一个最大概率并不合适。（每一步生成都是概率最大的，但是对于整个句子不是概率最大的）

Beam Search

decoder每次输出并不是选择概率最大的词，而是选择概率最大的前几名作为输入。超参数就是top-k,用于确定前几名作为输入。

步骤：

假设我们词表有3个词， top-k设置2。

1.那么对于第一次输入<start>,输出会有3个概率分布。

2.我们在这个3个概率分布中选取前2个概率最大的值对应的词。

3.每个词作为下一时刻的输入，每个词有一个3个概率分布。然后在这2*3=6个概率分布中再选取概率前二的词作为下时刻的输入，依次循环下去，直到预测出<end>。

4.最终<end>会有两个概率输出我们选择最大的。

5.那么概率最大的<end>对应的整个链就是整个decoder的输出预测结果。

对于Beam Search并不是每一步预测一个词，而是直到预测出结尾<end>,才确定了每个step预测的词。最终哪个<end>概率最大就选择那个<end>链上所有的词作为输出。

海滩上的那乌克丽丽

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
NLG过程的优化与项目Inference

NLG：自然语言生成我们在做完train训练之后，需要对测试数据集进行测试，也就是NLG的过程。Greed Search（贪婪Search）：做法：我们在训练好模型后，seq2seq的Decoder做预测的过程中，从<start>的标签开始输入，预测出最大的概率对应的词，作为decoder下一步的输入,输入后再次预测一个最大概率的词，再将这个词作为下个步骤的输入，依次循环下去直到，最后输出<end>，代表这句话预测结束。Greed Search
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。