![](https://img-blog.csdnimg.cn/20190927151117521.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
LLM-模拟
文章平均质量分 93
LLM-模拟
nopSled
一周一更
展开
-
AgentSims: An Open-Source Sandbox for Large Language Model Evaluation翻译
LLM彻底改变了自然语言处理 (NLP) 及其他领域。它们在小样本学习、代码生成、推理和其他任务中表现出巨大的潜力。此外,由LLM驱动的自动智能体广泛被应用于解决复杂问题,如多模态生成、软件开发和社会模拟。尽管LLM改革了自然语言处理的范式,但评估问题一直困扰着这个领域。旧的基准已经过时了。由于LLM达到了人类水平的自然语言理解(NLU)和自然语言生成(NLG)能力。翻译 2023-08-27 19:25:48 · 291 阅读 · 0 评论 -
Language Models Meet World Models: Embodied Experiences Enhance Language Models翻译
语言模型(LM)在各种自然语言处理任务上表现出了令人印象深刻的表现。特别是,最近的研究表明,LM可以协助完成实体任务的决策,这证明了LM对物理世界具有一定程度的理解。但是,对于在物理环境中的许多推理和计划任务,这种理解还不够强大。如图1所示,即使是最新的大型LM,例如ChatGPT,仍然会在看似简单的查询中犯错误,例如计算指定位置上的目标数目。我们认为这是因为仅通过大规模文本语料库训练的LM没有实际的经验,例如在环境中导航,与目标互动,感知以及跟踪世界状态。翻译 2023-06-12 15:38:31 · 206 阅读 · 0 评论 -
AlpacaFarm: A Simulation Framework for Methods that Learn from Human Feedback翻译
大型语言模型(LLM)在遵循多样化以及开放领域的指令方面表现出了前所未有的能力。这些成就通常归因于使用人类反馈对经过预训练的LLM进行微调,但是由于缺乏有关LLM训练方法的开源信息,因此该过程仍然很难理解。例如,最近揭示了在OpenAI的指令模型系列中,只有Davinci003模型使用了基于PPO算法的强化学习(RL),这使一些人质疑RL在训练过程中的重要性。理解和改进这些方法需要对训练过程进行开放和透明,但是由于与从人类反馈中进行学习的方法相关的成本和复杂性,这仍然具有挑战性。翻译 2023-05-30 14:08:45 · 220 阅读 · 0 评论