“教师强制“（Teacher Forcing）和“计划采样“（Scheduled Sampling）

M-Day

已于 2023-10-17 14:30:37 修改

阅读量790

点赞数 1

文章标签：机器学习深度学习人工智能

于 2023-10-17 14:30:11 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44130900/article/details/133883261

版权

"教师强制"（Teacher Forcing）是一种在训练序列到序列模型时常用的技巧。在这种训练方法中，模型不是使用它自己在上一个时间步的预测作为下一个时间步的输入，而是使用真实的上一个时间步的输出。这样做有以下几个好处：

更快的收敛：使用真实的历史数据而不是模型的预测可以使模型更快地收敛，因为它不会因为早期预测的错误而被误导。
防止累积错误：在序列预测的早期阶段，一个小错误可能会导致后续预测的连锁反应错误。通过使用真实的数据，我们可以防止这种错误的累积。
更稳定的训练：由于每个时间步都使用真实的数据，训练过程可能会更稳定，因为模型不会因为自己的不稳定预测而受到影响。

然而，这种方法也有一个缺点：在真实的应用中，模型在预测时不会有访问到真实的历史数据。因此，当从训练切换到预测时，可能会出现一个所谓的"曝露偏差"（Exposure Bias）。这是因为模型在训练时一直看到了真实的数据，但在预测时只能依赖于它自己的预测。为了解决这个问题，研究人员经常使用一种称为"计划采样"（Scheduled Sampling）的技巧，在训练过程中逐渐减少教师强制并增加模型自己的预测。

在给定的代码中，通过复制目标列并将其放在数据框的前面，我们为模型提供了真实的历史数据，使其可以在训练时使用教师强制技巧。

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
1
评论
“教师强制“（Teacher Forcing）和“计划采样“（Scheduled Sampling）

然而，这种方法也有一个缺点：在真实的应用中，模型在预测时不会有访问到真实的历史数据。这是因为模型在训练时一直看到了真实的数据，但在预测时只能依赖于它自己的预测。在这种训练方法中，模型不是使用它自己在上一个时间步的预测作为下一个时间步的输入，而是使用真实的上一个时间步的输出。在给定的代码中，通过复制目标列并将其放在数据框的前面，我们为模型提供了真实的历史数据，使其可以在训练时使用教师强制技巧。：使用真实的历史数据而不是模型的预测可以使模型更快地收敛，因为它不会因为早期预测的错误而被误导。
复制链接

扫一扫

M-Day CSDN认证博客专家 CSDN认证企业博客

码龄6年

19: 原创

140万+: 周排名

11万+: 总排名

7907: 访问

: 等级

194: 积分

4: 粉丝

2: 获赞

16: 评论

13: 收藏

私信

关注

热门文章

最新评论

概率密度函数与核密度函数的区别
DawsonD: 引用「Kernel Density Function，KDF」？？？是想写KDE吗？
根据页面原型完成员工管理页面开发，并通过Axios完成数据异步加载。
CSDN-Ada助手: 恭喜您完成了这篇关于员工管理页面开发的博客！不仅展示了对页面原型的理解和应用，还成功地运用了Axios实现了数据的异步加载，真是技术娴熟！接下来，建议您可以尝试深入探讨页面交互设计或者增加一些实用功能，让您的博客内容更加丰富多彩。期待您更多精彩的创作！
Anaconda创建新环境和删除环境
CSDN-Ada助手: 恭喜你写了第11篇博客！看到你分享了Anaconda创建新环境和删除环境的内容，我感到非常兴奋。我想建议你在下一篇博客中可以尝试分享一些实际应用场景下如何使用Anaconda创建新环境和删除环境，这样可以让读者更好地理解和运用这些知识。期待你的下一篇博客！加油！
cut函数对连续值离散化
CSDN-Ada助手: 恭喜你写了第14篇博客！看到你探讨了关于cut函数对连续值离散化的内容，我感到非常欣慰。接下来，我建议你可以尝试探讨一下不同离散化方法的优缺点，并结合实际案例进行分析，这样可以让读者更好地理解和应用这些方法。希望你能继续保持创作的热情，期待你的下一篇博客！
ctgan的条件向量
CSDN-Ada助手: 恭喜您撰写了关于“ctgan的条件向量”的第15篇博客！您的持续创作令人钦佩。阐述ctgan的条件向量将为读者提供更深入的理解，这对于那些对该主题感兴趣的人来说无疑是一份宝贵的资源。在接下来的创作中，或许您可以考虑探讨一些实际案例，展示ctgan的条件向量如何在实际问题中发挥作用。这样的实例将有助于读者更好地理解并应用相关概念。再次感谢您的不断努力，期待您未来更多创作的分享！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。