自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

qq_43183860的博客

北在哪 CSDN认证博客专家 CSDN认证企业博客

码龄6年

111: 原创

33万+: 周排名

212万+: 总排名

10万+: 访问

: 等级

1411: 积分

9: 粉丝

77: 获赞

13: 评论

233: 收藏

私信

关注

热门文章

分类专栏

最新评论

论文笔记：Making Pre-trained Language Models Better Few-shot Learners
yyxyyyxxx: 同问，所以是用的穷举的方法吗？
论文笔记：Making Pre-trained Language Models Better Few-shot Learners
xxp2000_: 请问一下，有没有全自动的方案（这是半自动的）
论文笔记：PPT: Pre-trained Prompt Tuning for Few-shot Learning
25小硕勇闯NLP算法diary: 那这种软提示是怎么设计的呢
论文笔记：Prefix-Tuning: Optimizing Continuous Prompts for Generation
爱吃奶糖_: 我还有一些疑惑的地方在于：原始的prefix方法（就是不是后面提到的embedding-only），假设前缀长度是3，那么他相当于只提供了这3个位置的transformer的所有层的向量。但是这个向量是不包含词嵌入层的对吗？（本质上，就不是实体token前缀，所以没有词嵌入层这一说）然后后续的embedding-only，他是认为存在虚拟的token，所以相比于上面说的，多了一个词嵌入层的向量。我这个理解对么？
论文笔记：Prefix-Tuning: Optimizing Continuous Prompts for Generation
爱吃奶糖_: 额外提一句就是，这个blog的最后一句话：“prefix-tuning添加的前缀向量不参与attention计算，每一层都保持不变” 我认为这个是不是这个博主理解错了，如果前缀向量每一层都保持不变，那怎么更新参数啊？这不是矛盾了吗？论文说的就是通过训练来更新这个prefix向量，而保持transformer的参数不变。你认为呢？

最新文章

自然语言处理

关注

文章平均质量分 76

关注数：文章数：23 文章阅读量：32906 文章收藏量：98

作者: 北在哪

这个作者很懒，什么都没留下…

展开