一只布噜噜-CSDN博客

原创论文讨论｜Ontolabeling：一种将数据结构与语义分离的标注方法，从而实现计算机视觉数据的长期可用、相互兼容、扩展与重用

中文翻译版在过去的十年中，计算机视觉任务的发展一直由图像、视频和多模态基准数据集推动，这些数据集促进了目标检测、分类和场景理解等机器学习方法的发展。然而，这个过程中实际创造了静态的、特定目标的、异构的数据集，而几乎完全没有关注类定义背后的分类法和语义，使得这些数据集定义不明确，难以相互映射。这种标注方法限制了数据集的长期可用性、彼此的兼容性、可扩展性和可重用性。在这项工作中，我们提出了一种新的数据标注方法，我们称之为Ontolabeling，它将数据结构与语义分离，创建了两个数据层。

2024-04-09 22:26:28 648

原创论文讨论｜Agent-FLAN：通过精心设计训练语料，提升Agent表现，缓解幻觉问题

开源的大型语言模型（LLMs）在各种自然语言处理（NLP）任务中取得了巨大成功，然而，当作为代理时，它们仍然远远不如基于API的模型。如何将代理能力整合到通用LLMs中，成为一个关键且紧迫的问题。本文首先提出了三个关键观察：（1）当前的代理训练语料库同时包含格式遵循与代理推理内容，这与预训练数据的分布显著偏离；（2）LLMs在代理任务所需的能力上展现出不同的学习速度；（3）当前的方法在提升代理能力时引入了幻觉等副作用。基于上述发现，我们提出了Agent-FLAN，旨在有效地为代理微调语言模型。

2024-03-30 19:59:20 1002

空空如也

如何测试prompt的效果？

2024-04-22

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 论文讨论｜Ontolabeling：一种将数据结构与语义分离的标注方法，从而实现计算机视觉数据的长期可用、相互兼容、扩展与重用

原创 论文讨论｜Agent-FLAN：通过精心设计训练语料，提升Agent表现，缓解幻觉问题

空空如也

如何测试prompt的效果？

原创论文讨论｜Ontolabeling：一种将数据结构与语义分离的标注方法，从而实现计算机视觉数据的长期可用、相互兼容、扩展与重用

原创论文讨论｜Agent-FLAN：通过精心设计训练语料，提升Agent表现，缓解幻觉问题