计算机前沿技术-人工智能算法-大语言模型-最新论文阅读-2024-09-13_what is the role of small models in the llm era: a-CSDN博客

本文链接：https://blog.csdn.net/fyf2007/article/details/142214241

计算机前沿技术-人工智能算法-大语言模型-最新论文阅读-2024-09-13

1. OneEdit: A Neural-Symbolic Collaboratively Knowledge Editing System

Authors: Ningyu Zhang, Zekun Xi, Yujie Luo, Peng Wang, Bozhong Tian, Yunzhi
Yao, Jintian Zhang, Shumin Deng, Mengshu Sun, Lei Liang, Zhiqiang Zhang,
Xiaowei Zhu, Jun Zhou, Huajun Chen

摘要

文章介绍了一个名为OneEdit的神经符号协作知识编辑系统。该系统结合了符号知识图谱（KGs）和大型语言模型（LLMs）来表示知识。OneEdit通过自然语言促进了对KG和LLM的轻松管理，包括三个主要模块：解释器（Interpreter）、控制器（Controller）和编辑器（Editor）。解释器负责理解用户意图，控制器管理来自不同用户的编辑请求并使用KG解决知识冲突，编辑器则利用控制器提供的知识来编辑KG和LLM。实验结果表明，OneEdit在处理知识冲突方面表现优异。

在这里插入图片描述

算法模型
OneEdit系统设计包括三个主要组件：

解释器（Interpreter）：作为用户与控制器之间的接口，负责识别用户用自然语言表达的意图。
控制器（Controller）：管理来自不同用户的编辑请求，使用KG解决冲突并增强知识。
编辑器（Editor）：主要使用控制器增强的知识三元组来编辑KG和LLM。

系统通过存储每次知识编辑后的编辑参数，采用空间换时间的策略，显著减少了VRAM和时间开销。

实验效果
实验在两个新的数据集上进行，一个关注美国政治人物，另一个关注学术人物，两者都包含KG。结果表明，OneEdit在使用Qwen2-7B和GPT-J-6B模型时，能够实现神经符号协作知识编辑，并在处理知识冲突问题上超越了基线方法。

2. NSP: A Neuro-Symbolic Natural Language Navigational Planner

Authors: William English, Dominic Simon, Rickard Ewetz and Sumit Jha

摘要
本文提出了一个名为NSP的神经符号自然语言导航规划框架，该框架利用大型语言模型（LLMs）的神经推理能力来解析自然语言输入，并将其转换为符号表示的环境和路径规划算法。通过在符号执行环境和神经生成过程之间建立反馈循环，NSP能够自我修正语法错误并满足执行时间约束。在1500个路径规划问题的基准测试套件上的实验评估表明，NSP方法产生的有效路径比例为90.1%，且这些路径平均比最先进的神经方法短19-77%。
在这里插入图片描述

创新点

提出了一种神经符号方法来解决自由形式自然语言中的路径规划问题，该方法利用了符号方法的优势，同时避免了预定义符号表示的需要。
引入了从执行环境到神经生成过程的神经符号反馈循环，能够解决由LLM生成的幻觉和语法错误，显著提高了自然语言到符号翻译的鲁棒性。
使用1500个自然语言路径规划场景数据集评估了所提出的方法，与基于最新LLM的方法相比，NSP框架将有效路径成功率提高了最多76%。

算法模型
NSP框架包括以下主要组件：

神经符号翻译：使用LLM将自然语言输入转换为符号表示，包括环境的图表示和路径规划算法。
神经符号规划与反馈：执行算法以产生解决方案路径，如果遇到编译错误或执行超时，则通过反馈循环进行自我修正。

实验效果

在包含5至25个房间的路径规划场景中，NSP在成功率、最优路径率和路径效率方面均优于基线方法。
NSP在最少反馈循环迭代次数下实现了高成功率，平均每次输入仅需执行1.82次反馈循环。
在处理更复杂的路径规划问题时，NSP保持了高效率，即使在房间数量增加时，其性能下降幅度也远小于其他方法。

综上所述，NSP通过结合神经推理和符号验证，有效地解决了自然语言路径规划问题，并在多个评估指标上展现了其优越性。

3. Explanation, Debate, Align: A Weak-to-Strong Framework for Language Model Generalization

Authors: Mehrdad Zakershahrak, Samira Ghodratnama

解释、辩论、对齐：一种用于语言模型泛化的弱到强框架

摘要
这篇文章探讨了人工智能系统快速发展带来的AI对齐挑战，特别是在复杂决策和任务执行中。随着这些系统在复杂问题上超越人类水平的表现，确保它们与人类价值观、意图和道德准则的对齐变得至关重要。文章基于先前在解释生成方面的工作，提出了一种新的方法，通过弱到强的泛化来实现模型对齐。该方法通过一个促进函数Φ，允许从高级模型向能力较弱的模型转移能力，而无需直接访问大量的训练数据。研究结果表明，这种基于促进的方法不仅提高了模型性能，还为模型对齐的本质和对高级AI系统的可扩展监督提供了洞见。

创新点