李宏毅NLP第九节

qq_53554496

已于 2024-05-08 17:14:22 修改

阅读量313

点赞数 4

文章标签：自然语言处理人工智能深度学习

于 2024-05-08 17:13:37 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_53554496/article/details/138576127

版权

bert

过去的模型：

以token作为输入，每个token输出一个embedding

上下文模型：

以整个句子为编码，分割token，再生成embedding

微调介绍

多句子输入：加入特殊位置标记作为token

任务一：句子种类输出：加入cls标志，该标志跟整个句子信息有关，embedding输出分类

任务二：每个token进行分类

任务三：QA,输入文献d，问题q，模型返（回e，s）为文献d中起止字符位数

具体过程，两个特征向量对token embedding做dot product，使用softmax输出概率最大位置

任务四：文转文，第一种架构，弊端是decoder不能使用预训练模型

架构2，将预训练模型同时用作编码器和解码器

微调分类：全局微调和局部微调，全局微调效果更好。

全局微调会产生多个big的预训练model，存在弊端

在预训练模型中加入apt层，只微调apt层，固定其余部分，节省空间，同样达到优秀效果

调apt层效果接近全局微调，蓝色线为只调预训练模型的部分层

权重学习，学习w1和w2参数

微调具有更高的general 特性。越平缓，泛化性越好

关注

4
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
李宏毅NLP第九节

任务一：句子种类输出：加入cls标志，该标志跟整个句子信息有关，embedding输出分类。在预训练模型中加入apt层，只微调apt层，固定其余部分，节省空间，同样达到优秀效果。任务三：QA,输入文献d，问题q，模型返（回e，s）为文献d中起止字符位数。任务四：文转文，第一种架构，弊端是decoder不能使用预训练模型。以整个句子为编码，分割token，再生成embedding。调apt层效果接近全局微调，蓝色线为只调预训练模型的部分层。微调分类：全局微调和局部微调，全局微调效果更好。
复制链接

扫一扫

博客等级

码龄4年

39
原创

147
点赞

49
收藏

99
粉丝

关注

私信

热门文章

最新评论

代码随想录day3
CSDN-Ada助手: 恭喜您第8篇博客的问世，持续创作真是令人钦佩！在“代码随想录day3”的内容中，您对编程知识的总结和思考让人受益匪浅。希望您能继续保持创作的热情，不断探索新的主题和观点，或许可以尝试分享一些实际项目中的应用经验或技术实践，让读者更加深入地了解编程世界的奥秘。期待您更加精彩的创作，加油！
代码随想录day2
CSDN-Ada助手: 恭喜您写完了第7篇博客“代码随想录day2”！持续创作是非常了不起的事情，希望您能坚持下去，继续分享您的思考和经验。或许在接下来的创作中，可以尝试探讨一些更深入的技术问题，或者分享一些实用的学习方法，这样能够吸引更多读者并且提升自身的技术水平。期待您的下一篇精彩文章！
代码随想录day1
CSDN-Ada助手: 恭喜你写了第6篇博客《代码随想录day1》，坚持不懈地创作是非常难得的品质，希望你能继续保持这种创作的热情和毅力。下一步建议可以尝试更多不同的主题和写作风格，拓宽自己的写作视野，让读者在每篇博客中都能收获新的启发和感悟。期待你的更多精彩作品！
代码随想录第一、二节
CSDN-Ada助手: 恭喜你开始了博客创作的第一步！阅读了你的《代码随想录第一、二节》，感觉内容丰富，思考深刻。建议在未来的创作中，可以更加深入地探讨代码与思想的关系，或者分享一些实际的编程经验和技巧，让读者能够从中获益更多。期待你的下一篇作品！继续加油！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
李宏毅NLP第八节
CSDN-Ada助手: 非常棒的博客！看到你对李宏毅NLP第八节的总结，我感到非常欣慰。希望你能继续保持写作的热情，分享更多有趣的内容。除了标题和摘要中提到的内容，我想分享一些关于情感分析和情感识别的知识。情感分析是NLP领域一个非常重要的应用方向，它可以帮助我们理解文本中的情感倾向和情绪状态，对于舆情监控、产品评价等方面都有很大的帮助。希望你能在未来的学习中涉猎更广，不断充实自己的知识储备。期待你更多的精彩分享！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。