李宏毅NLP第十节

qq_53554496

已于 2024-05-09 20:01:10 修改

阅读量230

点赞数 3

文章标签：自然语言处理人工智能深度学习

于 2024-05-09 17:54:03 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_53554496/article/details/138621776

版权

具体微调方法：

1.采用翻译的方法。需要配对的pairs

2.自监督训练，输入上下文，预测其中某个位置

每个位置只输入前文，对向量做softmax和交叉熵得到结果

规定每个位置的输入

elmo中提取上下午的方法，先分别预测w4和w5，再把两个向量concat作为w4的预测

bert中的做法，预测位置设置为mask或者随机向量，每个位置预测时输入的大小是相同的。

bert的思路和之前的一篇文章类似，不过模型复杂的多

bert随机选取一个token盖住

wwm采用连续的mask盖住一整个词

spanbert采用不同长度的mask，采取不同的分布，随机盖住token

spanbert里特殊的部分，sbo模块，输入左右连个embedding和要预测的mask中的某个token的位置

xlnet打乱顺序，预测embeding

bert不适合做生成式任务，训练过程中要读全文，而生成只有上文

解决：

bert只能当encoder，但可以借助bert训练一个decoder，训练过程如下，对文本进行还原：

但是要对输入文本进行一个破坏。

破坏方式如下

unilm同时训练三个框架

ELECTRA对token进行二分类，用于判断哪个词是被换掉的，其中被替换的词由small bert生成

15.Sentence Embedding

用一个向量来表示整个句子

skip thought 两个不同的句子，他们下一句可以接的句子都很像，那么这两个句子的向量应该很相似。用上一个句子预测下一个句子
quich thought：如果两个句子是相邻的，那么这两个句子的向量应该是越相似越好。两个下文问句子具有很高的相似度。

NSP，SOP，

nsp是输入两个句子，预测是不是相邻的两个句子。
sop是交换两个句子的顺序之后，则输出是no。

关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
李宏毅NLP第十节

elmo中提取上下午的方法，先分别预测w4和w5，再把两个向量concat作为w4的预测。bert中的做法，预测位置设置为mask或者随机向量，每个位置预测时输入的大小是相同的。每个位置只输入前文，对向量做softmax和交叉熵得到结果。bert的思路和之前的一篇文章类似，不过模型复杂的多。2.自监督训练，输入上下文，预测其中某个位置。1.采用翻译的方法。需要配对的pairs。
复制链接

扫一扫

qq_53554496 CSDN认证博客专家 CSDN认证企业博客

码龄4年

39: 原创

46万+: 周排名

6万+: 总排名

8211: 访问

: 等级

553: 积分

109: 粉丝

163: 获赞

4: 评论

64: 收藏

私信

关注

热门文章

最新评论

代码随想录day3
CSDN-Ada助手: 恭喜您第8篇博客的问世，持续创作真是令人钦佩！在“代码随想录day3”的内容中，您对编程知识的总结和思考让人受益匪浅。希望您能继续保持创作的热情，不断探索新的主题和观点，或许可以尝试分享一些实际项目中的应用经验或技术实践，让读者更加深入地了解编程世界的奥秘。期待您更加精彩的创作，加油！
代码随想录day2
CSDN-Ada助手: 恭喜您写完了第7篇博客“代码随想录day2”！持续创作是非常了不起的事情，希望您能坚持下去，继续分享您的思考和经验。或许在接下来的创作中，可以尝试探讨一些更深入的技术问题，或者分享一些实用的学习方法，这样能够吸引更多读者并且提升自身的技术水平。期待您的下一篇精彩文章！
代码随想录day1
CSDN-Ada助手: 恭喜你写了第6篇博客《代码随想录day1》，坚持不懈地创作是非常难得的品质，希望你能继续保持这种创作的热情和毅力。下一步建议可以尝试更多不同的主题和写作风格，拓宽自己的写作视野，让读者在每篇博客中都能收获新的启发和感悟。期待你的更多精彩作品！
代码随想录第一、二节
CSDN-Ada助手: 恭喜你开始了博客创作的第一步！阅读了你的《代码随想录第一、二节》，感觉内容丰富，思考深刻。建议在未来的创作中，可以更加深入地探讨代码与思想的关系，或者分享一些实际的编程经验和技巧，让读者能够从中获益更多。期待你的下一篇作品！继续加油！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
李宏毅NLP第八节
CSDN-Ada助手: 非常棒的博客！看到你对李宏毅NLP第八节的总结，我感到非常欣慰。希望你能继续保持写作的热情，分享更多有趣的内容。除了标题和摘要中提到的内容，我想分享一些关于情感分析和情感识别的知识。情感分析是NLP领域一个非常重要的应用方向，它可以帮助我们理解文本中的情感倾向和情绪状态，对于舆情监控、产品评价等方面都有很大的帮助。希望你能在未来的学习中涉猎更广，不断充实自己的知识储备。期待你更多的精彩分享！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。