每日学术速递5.23

CV - 计算机视觉 |  ML - 机器学习 |  RL - 强化学习 | NLP 自然语言处理  

Subjects: cs.CL

1.Tree of Thoughts: Deliberate Problem Solving with Large Language Models

标题:思想树:用大型语言模型有意识地解决问题

作者:Shunyu Yao, Dian Yu, Jeffrey Zhao, Izhak Shafran, Thomas L. Griffiths, Yuan Cao, Karthik Narasimhan

文章链接:https://arxiv.org/abs/2305.10601

项目代码:https://github.com/ysymyth/tree-of-thought-llm

摘要:

        语言模型越来越多地用于解决各种任务的一般问题,但在推理过程中仍局限于令牌级、从左到右的决策过程。这意味着他们可能无法完成需要探索、战略前瞻或初始决策起关键作用的任务。为了克服这些挑战,我们引入了一个新的语言模型推理框架,即思想树 (ToT),它概括了流行的思想链方法来提示语言模型,并能够探索连贯的文本单元(思想)作为解决问题的中间步骤。ToT 允许 LM 通过考虑多种不同的推理路径和自我评估选择来执行深思熟虑的决策,以决定下一步的行动方案,并在必要时向前看或回溯以做出全局选择。我们的实验表明,ToT 显着增强了语言模型在需要非平凡计划或搜索的三个新任务上的问题解决能力:24 岁游戏、创意写作和迷你填字游戏。例如,在 Game of 24 中,虽然带有思维链提示的 GPT-4 只解决了 4% 的任务,但我们的方法达到了 74% 的成功率。

2.Learning the Visualness of Text Using Large Vision-Language Models

标题:使用大型视觉语言模型学习文本的视觉效果

作者:Gaurav Verma, Ryan A. Rossi, Christopher Tensmeyer, Jiuxiang Gu, Ani Nenkova

文章链接:https://arxiv.org/abs/2305.10434

摘要:

        视觉文本会在人们的脑海中唤起图像,而非视觉文本则无法做到这一点。一种自动检测文本视觉性的方法将解锁用相关图像增强文本的能力,因为神经文本到图像的生成和检索模型在输入文本本质上是视觉的隐含假设下运行。我们整理了一个包含 3,620 个英语句子的数据集及其由多个人工注释者提供的视觉分数。此外,我们使用包含文本和视觉资产的文档来创建文档文本和相关图像的远程监督语料库。我们还提出了一种微调策略,使大型视觉语言模型(如 CLIP)适应假设文本和图像之间存在一对一对应关系的大型视觉语言模型,以完成仅从文本输入中对文本视觉性进行评分的任务。我们的策略涉及修改模型的对比学习目标,将识别为非视觉的文本映射到普通的 NULL 图像,同时将视觉文本与文档中的相应图像匹配。我们评估所提出的方法的能力 (i) 准确地对视觉和非视觉文本进行分类,以及 (ii) 关注在心理语言学研究中被识别为视觉的单词。实证评估表明,我们的方法比拟议任务的几种启发式和基线模型表现更好。此外,为了强调文本可视化建模的重要性,我们对 DALL-E 等文本到图像生成系统进行了定性分析。

3.CooK: Empowering General-Purpose Language Models with Modular and Collaborative Knowledge

标题:Cook:使用模块化和协作知识增强通用语言模型

作者:Shangbin Feng, Weijia Shi, Yuyang Bai, Vidhisha Balachandran, Tianxing He, Yulia Tsvetkov

文章链接:https://arxiv.org/abs/2304.05977

摘要:

        大型语言模型 (LLM) 越来越多地被用于知识密集型任务和上下文。现有方法通过检索或生成知识提示来提高通用 LLM 的知识能力,但它们未能反映知识丰富模型的两个关键属性:知识应该是模块化的、不断增长的、来自不同领域的;知识的获取和生产应该是一个协作过程,不同的利益攸关方在此过程中提供新的信息。为此,我们提出了 CooK,这是一种新颖的框架,可以为通用大型语言模型提供模块化和协作来源的知识。我们首先介绍专门的语言模型,即在来自广泛领域和来源的语料库上训练的自回归模型。这些专门的 LM 作为参数化知识库,稍后会提示为通用 LLM 生成背景知识。然后,我们提出了三个知识过滤器,通过控制相关性、简洁性和真实性来动态选择和保留生成的文档中的信息。最后,我们提出了自下而上和自上而下的知识集成方法,以使用来自社区驱动的专业 LM 的精选(相关的、事实的)知识来增强通用 LLM,从而实现多领域知识合成和按需知识请求。通过广泛的实验,我们证明了 Cook 在六个基准数据集上实现了最先进的性能。我们的结果突出了用不断发展的模块化知识丰富通用 LLM 的潜力——相关知识可以通过研究界的集体努力不断更新。

更多Ai资讯:公主号AiCharm
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
要安装Keil 5.23并使用ARM9微控制器,您需要按照以下步骤进行操作: 1. 首先,您需要下载Keil 5.23软件安装包。您可以在Keil官方网站上找到最新版本的软件,并选择与您的操作系统相匹配的版本进行下载。 2. 下载完成后,双击安装包文件并按照提示进行安装。请确保您具有管理员权限以完成安装。 3. 在安装过程中,您将需要选择适合您的开发环境和预期用途的安装选项。请确保选择与ARM9微控制器兼容的选项和工具链。 4. 完成安装后,启动Keil 5.23软件。您将看到一个初始界面,该界面是Keil的集成开发环境(IDE)。 5. 接下来,您需要创建一个新的项目或打开一个现有项目。如果您是初学者,建议您选择创建一个新的项目,以便您可以从头开始配置和编程。 6. 创建新项目后,您需要选择正确的微控制器型号。对于ARM9微控制器,您需要在设备列表中找到适合您的型号,并将其添加到项目中。 7. 完成设备选择后,您可以开始编写和调试代码。Keil提供了一套强大的工具,包括C编译器、调试器等,以帮助您进行代码开发和调试。 8. 完成代码开发后,您可以在Keil IDE中构建和下载程序到ARM9微控制器上。请确保您的目标设备与计算机连接,并正确配置IDE中的调试设置。 9. 最后,您可以通过Keil提供的调试工具进行代码调试和性能分析。这些工具可以帮助您定位和解决程序中的错误和性能问题。 10. 完成上述步骤后,您的ARM9开发环境就准备好了,您可以开始开发自己的项目并运行在ARM9微控制器上。 希望上述步骤对您有所帮助,并使您能够成功地安装和配置Keil 5.23以用于ARM9微控制器开发。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AiCharm

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值