【学习】domain adaptation、BERT

Raphael9900

于 2023-01-02 14:20:44 发布

阅读量731

点赞数

文章标签：学习深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Raphael9900/article/details/128519591

版权

文章目录

一、domain adaptation领域适应
二、自监督学习

一、domain adaptation领域适应

在这里插入图片描述
训练资料和测试资料分布不一样。
域转移domain shift:训练和测试数据有不同的分布。

domain shift

在这里插入图片描述
想法:通过源数据训练模型，然后通过目标数据微调模型
挑战:只有有限的目标数据，所以要小心过度拟合

domain adversarial training

希望他们的分布没有差异
在这里插入图片描述

右边的好一点，可以让他们远离界限，下面就是这种做法

domain generalization

没有未知领域的资料
在这里插入图片描述

二、自监督学习

在这里插入图片描述

多语言BERT的跨语言能力

在这里插入图片描述

无视不同语言的差别，了解语义。

在这里插入图片描述

MRR分数越高越好

实际上BERT在做QA的时候用的是同一种语言，可以看出语言之间是有差异的，只是没找到。

我们找到英文和中文符号之间的平均之后，得到差距，就能互换了

交叉学科能力

在这里插入图片描述

BERT在优化和generalization上都做的好

但是还是要有文字语音对应的资料

有没有可能只有语音资料呢？

训不了
把VQ进行离散化，加入自注意，不行：

把这些符号换成文字，可以实现：

用人工数据进行预训练

在这里插入图片描述

通过生成不同规则的人工数据，可以知道前期训练成功的关键因素是什么。

在这里插入图片描述

人工数据的预培训：与从头开始培训相比，平均绝对改进(%)
随机令牌上的预训练产生与从头开始训练相同的性能，没有用
成对资料有用：

产生连续编号的序列，打乱之后掩码，做的也比较好。

到底什么能力对NLP任务是有用的呢？
与从头开始培训相比，平均绝对改进(%)：
在这里插入图片描述
长序列对于任务是有用的。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
2
评论
【学习】domain adaptation、BERT

李宏毅深度学习
复制链接

扫一扫

Raphael9900 CSDN认证博客专家 CSDN认证企业博客

码龄5年

51: 原创

30万+: 周排名

214万+: 总排名

4万+: 访问

: 等级

593: 积分

21: 粉丝

25: 获赞

6: 评论

158: 收藏

私信

关注

热门文章

最新评论

【李宏毅】HW12
Raphael9900: 看看路径是不是对的
【李宏毅】HW12
weixin_50894238: 运行的时候出现系统找不到相应的文件
【学习】life long learning
智慧地球（AI·Earth）社区: 博主文章质量很高，，凤⭐尘必须给三连支持了。我正在参加CSDN创作者的申请，欢迎大佬给个关注三连哇！这是我的博客链接：https://blog.csdn.net/qq_36396104?type=blog 欢迎大佬加入我创办的互粉社区 (https://bbs.csdn.net/forums/together)，共同进步！
【学习】domain adaptation、BERT
不吃香菜哇: 大佬好文章、已三连、点赞+收藏+关注。如果可以的话麻烦给个星星、谢谢：https://bbs.csdn.net/topics/611389800
机器学习HW10对抗性攻击
妖娆的ヽ荣姐: 我正在参加年度博客之星评选，请您帮我投票打分，9级满原力回你。 https://bbs.csdn.net/topics/611388601 2023年，祝福博主新年快乐，好运连连

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。