机器学习基础篇-迁移学习+多任务学习

最新推荐文章于 2024-01-08 01:25:54 发布

Mr.Wiggles

最新推荐文章于 2024-01-08 01:25:54 发布

阅读量857

点赞数

分类专栏：机器学习基础文章标签：神经网络机器学习算法人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Vihagle/article/details/118459073

版权

机器学习基础专栏收录该内容

31 篇文章 4 订阅

订阅专栏

迁移学习-Transfer Learning

如果我们拥有大量的训练数据，或者神经网络特别的大，我们训练这样的一个模型是非常耗时的。幸运的是，有一些模型已经开源并可以公开使用的。通常，这些模型是在大量数据上进行训练的。

迁移学习的思想就是我们可以使用这些预先训练好的模型，并不断调整这个模型，使得它适应我们的问题。如下图所示：
在这里插入图片描述

如果我们拥有大量的训练数据，我们可以重新训练整个神经网络。
如果我们只有少量的训练数据，我们可以在预训练模型基础上，重新训练最后几层。

Q：在哪种场景可以使用预训练模型？

假设：现有适应任务A的预训练模型，和适应任务B的自身模型。

这两个任务应该具有相同的输入格式。
对于任务A，我们拥有大量的训练数据；对于任务B，数据量相对于任务A会少很多倍。
从任务A学习到的低阶特征，对任务B能起到提升的作用。

多任务学习-Multi-Task Learning

在常规分类任务中，通常每个实例都对应一个label。如下图所示。第 i 个实例仅对应于第二个类。
$y^{i} = (\begin{array}{c} 0\\ 1\\0\\0\\0 \end{array})$

然而，在多分类学习中，一个实例会对应多个label。
$y^{i} = (\begin{array}{c} 0\\ 1\\1\\1\\0 \end{array})$

损失函数：
$LossFunction=\frac{1}{m}\sum^m_{i=1}\sum^5_{j=1}L(\widehat{y}^i_j,y^i_j)\\ L(\widehat{y}^i_j,y^i_j) = -Y^i_jlog\widehat{y}^i_j-(1-y^i_j)log(1-y^i_j)$

m为样本数
j为第j个lable

对于多任务学习的一些Tips：

多任务学习会共享相同的低阶特征
对于多任务学习，我们可以尝试一个足够大的神经网络来处理所有任务
在训练集中，每个任务的实例数量相似

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
机器学习基础篇-迁移学习+多任务学习

迁移学习-Transfer Learning如果我们拥有大量的训练数据，或者神经网络特别的大，我们训练这样的一个模型是非常耗时的。幸运的是，有一些模型已经开源并可以公开使用的。通常，这些模型是在大量数据上进行训练的。迁移学习的思想就是我们可以使用这些预先训练好的模型，并不断调整这个模型，使得它适应我们的问题。如下图所示：如果我们拥有大量的训练数据，我们可以重新训练整个神经网络。如果我们只有少量的训练数据，我们可以在预训练模型基础上，重新训练最后几层。Q：在哪种场景可以使用预训练模型？假设：
复制链接

扫一扫

专栏目录

Mr.Wiggles CSDN认证博客专家 CSDN认证企业博客

码龄4年

87: 原创

2万+: 周排名

2万+: 总排名

6万+: 访问

: 等级

998: 积分

3791: 粉丝

92: 获赞

39: 评论

321: 收藏

私信

关注

热门文章

分类专栏

最新评论

工作繁忙 + 想法枯竭 = 许久未更
Mr.Wiggles: 如果样本不平衡，可以通过降/升采样的方法去缓解样本分布，但是得注意的是，一味的采样使得平衡并不是最终解决方法，采样后的分布还得参照自然分布。比如正样本只占到TTL的0.01%，我们通过采样使其占比变成3%即可，而不是强行变成正负样本五五开，因为采样后样本的分布不能脱离自然分布（比如买彩票的概率本身就极低）
训练集（离线）与测试集（上线）效果差距很大怎么办？
Mr.Wiggles: 我觉得分两点来看： 1.你可以对比做/不做smote，对比两个测试集的recall有没有uplift，如果有说明smote对模型的是有提升的 2.其次，smote影响recall可能只是个充分非必要条件，还得看你的数据质量高低，特征维度是否全面。这些也会影响模型的精度上限
训练集（离线）与测试集（上线）效果差距很大怎么办？
不暴饮暴食好难啊: 楼主，目前我也在做离职预测，用smote方法来平衡样本，在训练集和验证集表现挺好的，但是在测试集上的recal效果不好，这种情况怎么处理提高我的recall呢
工作繁忙 + 想法枯竭 = 许久未更
不暴饮暴食好难啊: 亲，想了解对于不平衡的数据集进行预测的问题，样本分类极度不均，可能一万个样本里只有几十个正样本
如何解释模型预测？常用4种可解释性分析方法~
Mr.Wiggles: 你直接调用sklearn里面的boston房价数据集就可以啦

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Mr.Wiggles 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。