157篇顶会论文,助你打赢大模型下半场

Agent是大模型现在最火热的一个方向,没有之一OpenAI联合创始人Andrej Karpathy宣布,AI Agent是下一个发力方向;比尔·盖茨发文表示5年内Agent将大行其道。大厂纷纷入局Agent,大模型的下半场比赛正式开始。

为什么大模型刚流行不久,就需要Agent?因为LLM目前还有幻觉、虚假、过时等问题。Agent以LLM为大脑驱动,能克服LLM的局限性,主动完成更复杂的任务。

Agent研究如火如荼,创新点更是层出不穷。这里为小伙伴们整理了157篇大模型Agent论文。包含ICLR2024、EMNLP2023、NeurIPS2023等多个顶会涉及Agent的构建、应用、评估等多个方面。

这份论文合集目前比较全面,适合所有想学Agent的同学们下载研读也许就能找到属于你的顶会idea

d2fc44de4dc19e144c12308d9c587acb.png

长按二维码获取157篇大模型Agent论文

157篇大模型Agent论文速看

5c48a8f8007f94e79922ad8c42dc1b5e.gif

59095d49db4c9115f87248ca5bad5a9c.gif

62045693f1ce9ad4b072db0a75748dc3.png

长按二维码获取157篇大模型Agent论文

此外,在LLM中的训练流程中,RLHF是不可或缺的一部分。它可以将人类偏好整合到优化图景中,从而提升模型的有用性和安全性。可以说RLHF是LLMs智能的关键之一

目前国内RLHF的研究不算太多,这个领域有许多的idea等待发现。12月21号20:00,我邀请了手握顶会论文数十篇、近10篇1作的大厂高级科学家Xz老师带来直播《大语言模型的RLHF》!

我整理了30篇大模型RLHF论文,预约直播即可领取~

5951c75f7a4db87bd60ff393b7eb5146.png

30篇大模型RLHF论文速看

95cab579e3bd5bd504fdfdcc79c34bf6.gif

a0c669abb33034f74f5dc323eba60a99.png

长按二维码,0.01元预约直播

领30篇大模型RLHF论文

领157篇大模型Agent论文

157篇大模型Agent论文速看

6d8c3f69d96698c3689a2ec773d8bae8.gif

e08789a2f08b7381294732cd81794f62.png

长按二维码,0.01元预约直播

领30篇大模型RLHF论文

领157篇大模型Agent论文

END

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值