论文阅读笔记《The MORAL INTEGRITY CORPUS: A Benchmark for Ethical Dialogue Systems》

最新推荐文章于 2024-07-24 20:06:37 发布

Real Maraid

最新推荐文章于 2024-07-24 20:06:37 发布

阅读量109

点赞数

分类专栏：论文笔记文章标签：论文阅读

原文链接：https://aclanthology.org/2022.acl-long.261.pdf

版权

论文笔记专栏收录该内容

13 篇文章 0 订阅

订阅专栏

道德诚信语料库：道德对话系统的基准

Abstract

内容警告：本文中的一些示例可能令人反感或不安。

在开放域对话环境中，对话代理越来越接近人类的能力；然而，这些模型可能反映出不敏感、有害或完全不连贯的观点，这些观点会侵蚀用户对系统道德完整性的信任。道德偏差很难缓解，因为道德判断不是普遍的，而且可能存在同时适用于某一情况的多个相互竞争的判断。在这项工作中，我们引入了一种新的资源，不是为了权威地解决道德模糊，而是为了促进对对话系统话语中反映的直觉、价值观和道德判断的系统理解。道德诚信语料库就是这样一个资源，它利用99k个不同的经验法则（Rules of Thumb，RoT），捕捉了38k个即时回复对的道德假设。每个RoT都反映了一种特殊的道德信念，可以解释为什么聊天机器人的回复看起来可以接受或有问题。我们进一步用一组9个道德和社会属性以及属性分类的基准性能来组织RoT。最重要的是，我们表明，当前的神经语言模型可以自动生成新的RoT，合理地描述以前未见过的交互，但它们仍在某些场景中挣扎。我们的研究结果表明，MIC将成为理解和语言模型隐含道德假设的有用资源，并灵活地对会话主体的完整性进行基准测试。要下载数据，请参见https://github.com/GT-SALT/mic

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
论文阅读笔记《The MORAL INTEGRITY CORPUS: A Benchmark for Ethical Dialogue Systems》

内容警告：本文中的一些示例可能令人反感或不安。在开放域对话环境中，对话代理越来越接近人类的能力；然而，这些模型可能反映出不敏感、有害或完全不连贯的观点，这些观点会侵蚀用户对系统道德完整性的信任。道德偏差很难缓解，因为道德判断不是普遍的，而且可能存在同时适用于某一情况的多个相互竞争的判断。在这项工作中，我们引入了一种新的资源，不是为了权威地解决道德模糊，而是为了促进对对话系统话语中反映的直觉、价值观和道德判断的系统理解。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。