关于使用[MASK]做完形填空时需要注意的点

最新推荐文章于 2024-07-10 22:17:05 发布

365JHWZGo

最新推荐文章于 2024-07-10 22:17:05 发布

阅读量333

点赞数

文章标签：深度学习机器学习自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44833392/article/details/123483967

版权

NLP模型学习专栏收录该内容

64 篇文章 0 订阅

订阅专栏

文章目录

题目

关于使用[MASK]做完形填空时需要注意的点

关键点

Q1: 选取谁做[MASK]

A:关于这个问题取决于语料库中的每句话的平均长度

比如我在glue【sst2】中就对整个语料库中的所有句子进行了筛选【单词长度大于10】，取中选了第5个单词，又因为第一个token是[cls]所以input_ids[:,5]，其实是选择了第四个单词

Q2:如何实现[MASK]

A:因为bert中的编码是根据每一个单词进行编码的，所以我们只需要取到对应单词的encode编码并将它变为[MASK]

step1:先取出index位置的encode编码

labels = input_ids[:,index].reshape(-1).clone()	# [batch_size]

这里解释一下为什么要用clone()，原因是单纯使用reshape会破坏input_ids的结构，它是创建了一个新的指向数据的指针，两者还是共享一份数据，所以clone的作用在于重新创建，开辟一块心得内存空间存储。

step2: 将对应的index位置变为[MASK]

input_ids[:,index] = tokenizer.get_vocab()[tokenizer.mask_token]

Q3: 为什么自己训练的模型loss不会下降

A:我一开始也遇到这个问题了，后来看了别人的经验是nn.Linear(bias=False)，当对Linear函数里的偏置矩阵进行归0后，会发现loss开始下降。

另一个可能是因为BertModel比较难训练，当我该用AutoModelForMaskedLM时，模型很快就能收敛

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
关于使用[MASK]做完形填空时需要注意的点

文章目录题目关键点Q1: 选取谁做[MASK]Q2:如何实现[MASK]Q3: 为什么自己训练的模型loss不会下降题目关于使用[MASK]做完形填空时需要注意的点关键点Q1: 选取谁做[MASK]A:关于这个问题取决于语料库中的每句话的平均长度比如我在glue【sst2】中就对整个语料库中的所有句子进行了筛选【单词长度大于10】，取中选了第5个单词，又因为第一个token是[cls]所以input_ids[:,5]，其实是选择了第四个单词Q2:如何实现[MASK]A:因为bert中的编
复制链接

扫一扫

专栏目录

365JHWZGo CSDN认证博客专家 CSDN认证企业博客

码龄5年

544: 原创

2万+: 周排名

7475: 总排名

37万+: 访问

: 等级

5784: 积分

5656: 粉丝

195: 获赞

138: 评论

694: 收藏

私信

关注

热门文章

分类专栏

最新评论

《论文阅读》常识感知的提示用于可控的同情对话生成 2023
365JHWZGo: 抱歉，已更正来源
《论文阅读》常识感知的提示用于可控的同情对话生成 2023
Ec.ho: hello,我想问一下这个论文的具体出处，我在AAAI23上没找到
《论文阅读》通过顺序不敏感的表示正则化实现稳健的个性化对话生成 ACL 2023
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
《论文阅读》具有人格自适应注意的个性化对话生成 AAAI 2023
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
《论文阅读》学习了解自己：一个粗略到精细的个性化对话生成的人物感知训练框架 AAAI 2023
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

365JHWZGo 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。