推荐系统进化了,使用LLM完成用户偏好的对齐

研究介绍了一种新的推荐系统方法——生成式主动任务引导(GATE),通过LLM与用户的自由形式交互来理解和推断用户偏好。GATE区别于传统提示和主动学习,能更好地处理模糊偏好并适应真实世界场景。论文通过实验评估了这种方法在预测用户决策上的有效性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

推荐系统 --> 进化了,新的一种可能实现方式是基于LLM的生成式任务引导。

以下为论文核心精华:

生成式主动任务引导(GATE):一种学习框架,其中LLM通过与用户进行自由形式的基于语言的交互,引导和推断出用户预期的行为。

研究结果表明,基于语言模型的引导可以成为将模型与复杂的人类偏好和价值观对齐的强大工具。

5dd47c1c084c52eb824aa1e843ff691e.jpeg

21c76f9134344207e44ec63e8e6ef3b9.jpeg

生成式主动任务引导(GATE)通过互动的自由形式问题引导用户表达其偏好,然后将这些偏好用于后续的决策过程。与非互动引导方法(例如提示)不同,生成式引导能更好地探索人类偏好的细微差别。与主动学习方法不同,生成式引导可以提出更通用、自由形式的问题。图中的三个部分说明了:

(A)模糊用户偏好:用户希望将对任务执行方式的模糊偏好转化为机器学习模型的规范。这是具有挑战性的,因为用户缺乏完美的内省能力,偏好很难用语言来明确表达,规范需要预测棘手的真实世界边缘案例,并且模型可能会从提供的示例或指令中错误推断。

(B)任务引导:我们考虑了从用户那里引导这些模糊偏好的各种方法,包括非互动提示、主动学习和生成式引导(GATE)。

(C)评估:我们在一个保留的测试集上评估方法,评估语言模型预测用户真实决策的准确性。

https://arxiv.org/pdf/2310.11589.pdf

#MixCopilot

内容概要:本文详细介绍了施耐德M580系列PLC的存储结构、系统硬件架构、上电写入程序及CPU冗余特性。在存储结构方面,涵盖拓扑寻址、Device DDT远程寻址以及寄存器寻址三种方式,详细解释了不同类型的寻址方法及其应用场景。系统硬件架构部分,阐述了最小系统的构建要素,包括CPU、机架和模块的选择与配置,并介绍了常见的系统拓扑结构,如简单的机架间拓扑和远程子站以太网菊花链等。上电写入程序环节,说明了通过USB和以太网两种接口进行程序下载的具体步骤,特别是针对初次下载时IP地址的设置方法。最后,CPU冗余部分重点描述了热备功能的实现机制,包括IP通讯地址配置和热备拓扑结构。 适合人群:从事工业自动化领域工作的技术人员,特别是对PLC编程及系统集成有一定了解的工程师。 使用场景及目标:①帮助工程师理解施耐德M580系列PLC的寻址机制,以便更好地进行模块配置和编程;②指导工程师完成最小系统的搭建,优化系统拓扑结构的设计;③提供详细的上电写入程序指南,确保程序下载顺利进行;④解释CPU冗余的实现方式,提高系统的稳定性和可靠性。 其他说明:文中还涉及一些特殊模块的功能介绍,如定时器事件和Modbus串口通讯模块,这些内容有助于用户深入了解M580系列PLC的高级应用。此外,附录部分提供了远程子站和热备冗余系统的实物图片,便于用户直观理解相关概念。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值