AAAI2024论文解读|Human-Guided Moral Decision Making in Text-Based Games基于文本游戏的人类引导式道德决策

paixiaoxin

于 2025-01-20 16:04:05 发布

阅读量656

点赞数 19

分类专栏：文献阅读论文合集文章标签：深度学习人工智能机器学习强化学习道德决策人机协作文本游戏

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/paixiaoxin/article/details/145264144

版权

论文标题

Human-Guided Moral Decision Making in Text-Based Games
基于文本游戏的人类引导式道德决策

论文链接

Human-Guided Moral Decision Making in Text-Based Games论文下载

论文作者

Zijing Shi, Meng Fang, Ling Chen, Yali Du, Jun Wang

内容简介

本文提出了一种名为HuMAL（Human-guided Morality Awareness Learning）的算法，旨在通过人类引导的方式，使强化学习（RL）智能体在文本游戏中实现道德决策。该算法通过人机协作，利用有限的人类反馈自适应地学习个人价值观，并在Jiminy Cricket基准测试中验证了其有效性。实验结果表明，HuMAL能够在少量人类反馈下提升任务表现，减少不道德行为，并适应不同的个人价值观。该研究为强化学习智能体的道德对齐提供了新的思路。

分点关键点

1.HuMAL算法设计

HuMAL算法包含两个阶段：智能体学习和人机协作。在智能体学习阶段，代理

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。