自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 MetaL-Prompt论文理解

MetaL-Prompt是一种用于轻量级提示生成的元学习方法。其目标是生成能够增强语言模型(LM)上下文学习能力的提示。提示生成模型(PGM)的元训练PGM被初始化为目标语言模型,通过元训练生成有效提示。这一过程称为元学习,因为PGM学会生成能引导目标LM学习有效上下文的提示。可训练填充(Trainable Padding)为减少提示生成过程中多次前向传递的开销,MetaL-Prompt提出了可训练填充。这使PGM可以同时生成多个提示标记。提示设计。

2024-06-12 16:18:22 859

原创 Medprompt论文总结

在研究中,Medprompt方法通过结合三种主要技术:动态少样本选择(Dynamic Few-shot Selection)、自生成思维链(Self-generated Chain of Thought)和选项洗牌集成(Choice Shuffle Ensembling),来提升模型在医疗问答任务中的性能。以下是对每种技术的详细介绍及其在Medprompt方法中的综合应用。

2024-06-08 11:04:21 619

原创 REACT论文总结

图1展示了四种提示方法(prompting methods)在解决不同问题时的比较。这些提示方法分别是(a)标准(Standard)、(b)链式思考(Chain-of-thought, CoT, ReasonOnly)、(c)仅行动(Act-only),和(d)ReAct(Reason+Act),用于解决HotpotQA(Yang et al., 2018)问题和AlfWorld(Shridhar et al., 2020b)游戏中的任务。

2024-05-31 19:38:13 710

原创 Prompt论文理解

其次,我们要求模型描述所识别的子项目的设置(描述所识别的子项目的设置是指根据已经识别出的主题或子项目,详细描述与其相关的具体场景或环境。值得注意的是,当方面词(aspect word)包含多个标记时,其自身距离为0(就是把方面词当作一个整体,如果方面词由多个单词组成则视为一个单词),而正负距离则根据方面词的开始和结束位置来计算(因为方面词是一个整体,所以与方面词的距离按整体来算)。接着,根据原始句子中单词的顺序来确定这些距离的正负性,即句子中从前一个单词到后一个单词的距离为正,反之为负。

2024-05-29 17:15:29 763

原创 TextMonkey的论文理解

在这个移位之后,某些窗口内可能由几个在特征图中不相邻的子窗口组成,因此使用掩蔽机制将自注意计算限制在每个子窗口内(这个子窗口是指被移动的不同颜色的小块构成的,这些有颜色的部分会被遮盖)。最后,处理后的特征与输入问题相结合,并由大型语言模型进行分析,以产生所需的答案。为了实现更平滑的训练初始化,作者对转移的窗口注意力进行了修改,允许它们从零初始化开始学习,避免在初始阶段对早期特征进行过度转换。其中I是输入图像,Q是问题序列,s~是输出序列,s是输入序列, L是输出序列的长度。

2024-04-01 11:33:57 311

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除