自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 论文讨论|Ontolabeling:一种将数据结构与语义分离的标注方法,从而实现计算机视觉数据的长期可用、相互兼容、扩展与重用

中文翻译版在过去的十年中,计算机视觉任务的发展一直由图像、视频和多模态基准数据集推动,这些数据集促进了目标检测、分类和场景理解等机器学习方法的发展。然而,这个过程中实际创造了静态的、特定目标的、异构的数据集,而几乎完全没有关注类定义背后的分类法和语义,使得这些数据集定义不明确,难以相互映射。这种标注方法限制了数据集的长期可用性、彼此的兼容性、可扩展性和可重用性。在这项工作中,我们提出了一种新的数据标注方法,我们称之为Ontolabeling,它将数据结构与语义分离,创建了两个数据层。

2024-04-09 22:26:28 648

原创 论文讨论|Agent-FLAN:通过精心设计训练语料,提升Agent表现,缓解幻觉问题

开源的大型语言模型(LLMs)在各种自然语言处理(NLP)任务中取得了巨大成功,然而,当作为代理时,它们仍然远远不如基于API的模型。如何将代理能力整合到通用LLMs中,成为一个关键且紧迫的问题。本文首先提出了三个关键观察:(1)当前的代理训练语料库同时包含格式遵循与代理推理内容,这与预训练数据的分布显著偏离;(2)LLMs在代理任务所需的能力上展现出不同的学习速度;(3)当前的方法在提升代理能力时引入了幻觉等副作用。基于上述发现,我们提出了Agent-FLAN,旨在有效地为代理微调语言模型。

2024-03-30 19:59:20 1002

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除