Learning from Dialogue after Deployment: Feed Yourself, Chatbot!

chansonzhang

已于 2024-01-06 11:11:40 修改

阅读量424

点赞数

分类专栏： NLP Papers NLP AI 文章标签：人工智能深度学习机器学习

于 2023-06-17 23:09:09 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/chansonzhang/article/details/130166477

版权

NLP Papers 同时被 3 个专栏收录

54 篇文章 23 订阅 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

67 篇文章 2 订阅

订阅专栏

60 篇文章 1 订阅

订阅专栏

Abstract

对于一个 bot 来说，它一生中看到的最多的对话是出现在它被部署到生产环境之后，这就产生了大量未被利用的训练数据。本文提出一种 自馈对话机器人（self-feeding chatbot），它能够从它自己参与的对话中自动抽取新的训练样本。

在该 bot 参与对话的过程中，它还会评估用户的满意度。

当对话进展良好时，用户的回复成为需要模拟的训练样本
当 bot 认为自己犯了错误时，它会询问用户以获得反馈
- 学习预测这种反馈可以进一步提高 bot 的对话技能

在 PERSONACHAT 闲聊数据集上（包含 131k 训练样本），我们发现无论传统监督的数量如何，使用自馈对话机器人从对话中学习都显著提高了性能。

1 Introduction

训练一个 bot 使之像人类那样对话需要大量的监督。最常见的方式是训练一个模型来模拟大量众包或爬取的对话语料中的人类回复 (Serban et al., 2015)。这些对话语料要么收集代价高昂，要么其设置和真实的部署环境存在很大差别。相比之下，bot 最理想的学习方式是部署后从自己参与的对话中学习，因为此时遇到的样本往往是丰富、特定于具体任务、动态的以及廉价的。这和人类学习说话的方式类似，不仅仅是观察其他人进行 “专家级” 的对话，而是根据交织于我们自己的对话中的反馈，积极调整和纠正我们的对话。对于一个对话机器人来说，通过这项技能，它能够在它的一整个机生中持续提升和

了解本专栏

超级会员免费看

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Learning from Dialogue after Deployment: Feed Yourself, Chatbot!

让机器人在对话中学习
复制链接

扫一扫

专栏目录

chansonzhang CSDN认证博客专家 CSDN认证企业博客

码龄6年

98: 原创

4万+: 周排名

2万+: 总排名

14万+: 访问

: 等级

1810: 积分

434: 粉丝

102: 获赞

23: 评论

170: 收藏

私信

关注

热门文章

分类专栏

NLP Papers 付费 54篇
AI Platform 付费 4篇
Recommender Systems 2篇
Jax
PyTorch 1篇
TensorFlow 2篇
Spark 2篇
信号处理 1篇
Deep Learning 2篇
Recommend
NLP 60篇
笔记
AI 67篇
Python 2篇
Development Tools 3篇
Big Data 3篇
Cloud 8篇
Tools 3篇
IR 2篇
Windows 1篇
Algorithm 6篇
ML 5篇

最新评论

[Paper Notes] Deep Neural Networks for YouTube Recommendations
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性。
k8s集群证书管理
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加除了各种控件外，文章正文的字数。
VIM常用命令总结
CSDN-Ada助手: 为什么SVN曾经辉煌，后面被Git干掉了呢？
Learning from Dialogue after Deployment: Feed Yourself, Chatbot!
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/616055333。
人类历史上第一个推荐系统
捻墨: parc的翻译是认真的吗

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。