深度学习基础

high variance/data mismatch

what is data mismatch

如果训练集和验证集的loss不一样,且验证集的loss高很多,有2种原因:
1.方差太大。模型没见过,没学习到;
2.数据不匹配。训练集和验证集的数据分布不同。

how to solve data mismatch

currently no systematic ways to solve, so try:

  1. manually error analysis
  2. make training and dev sets more similar.

data synthesis数据合成

make similar的方法包括数据合成。比如含有噪音的音频。
但是要注意:噪音背景需要和清晰的音频一样diverse,不能音频有1000条,噪音只有1条,要不然可能过拟合。
该方法在音频识别种效果很好。

迁移学习与预训练/微调

迁移学习是原本适用于taskA的模型同样应用在taskB。
为了能够使其适用于TaskB,需要对模型进行进一步训练,这个过程取决于taskB的样本数量。

  1. 如果样本数量较少,就重新训练最后一层layer或最后几层,其他layers固定不变;
  2. 如果样本数量很多,可以对整个模型重新进行训练。
    对于最终的taskB来说,taskA过程的训练就是预训练,对于taskB的训练是微调。

什么时候用迁移学习

  1. taskA和taskB输入相同,如都是图片
  2. taskA的样本远多于taskB
  3. taskA的低层次特征low level features有助于taskB

什么时候用多任务学习

  1. 多个任务有共性的低维特征;
  2. 每个任务的数据集数量多比较多,不会像迁移学习一样不平衡

卷积

三维卷积

如果输入不是二维灰度图,而是一个RGB图或者高维图像,那么过滤器也会有跟高维图像相同的维度。
比如图像是6x6x3,filter是3x3x3,那么得到4x4x1。

如果想学习多个不同的特征怎么办呢?

可以使用多个filter,每个filter关注不同的特性。以上面的例子为例,假如有n个filter,那么得到4x4xn的输出。

损失

二分类损失

Focal loss

二分类损失常用的是交叉熵损失,但是这不能解决正负样本不平衡的问题,因此出现了Focal loss,对于易于分类(分类概率越高)的样本乘以较小的权重,对于不易于分类的样本乘以较大的权重。
参考:https://blog.csdn.net/BIgHAo1/article/details/121783011

  • 8
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值