深度学习基础

EEPI

已于 2024-06-06 15:24:00 修改

阅读量1.1k

点赞数 8

文章标签：深度学习人工智能

于 2024-02-12 21:26:52 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/eepii/article/details/136102952

版权

深度学习基础

high variance/data mismatch
迁移学习与预训练/微调
- 什么时候用迁移学习
- 什么时候用多任务学习
卷积
- 三维卷积
- - 如果想学习多个不同的特征怎么办呢？
损失
- 二分类损失
- - Focal loss

high variance/data mismatch

what is data mismatch

如果训练集和验证集的loss不一样，且验证集的loss高很多，有2种原因：
1.方差太大。模型没见过，没学习到；
2.数据不匹配。训练集和验证集的数据分布不同。

how to solve data mismatch

currently no systematic ways to solve, so try:

manually error analysis
make training and dev sets more similar.

data synthesis数据合成

make similar的方法包括数据合成。比如含有噪音的音频。
但是要注意：噪音背景需要和清晰的音频一样diverse，不能音频有1000条，噪音只有1条，要不然可能过拟合。
该方法在音频识别种效果很好。

迁移学习与预训练/微调

迁移学习是原本适用于taskA的模型同样应用在taskB。
为了能够使其适用于TaskB，需要对模型进行进一步训练，这个过程取决于taskB的样本数量。

如果样本数量较少，就重新训练最后一层layer或最后几层，其他layers固定不变；
如果样本数量很多，可以对整个模型重新进行训练。
对于最终的taskB来说，taskA过程的训练就是预训练，对于taskB的训练是微调。

什么时候用迁移学习

taskA和taskB输入相同，如都是图片
taskA的样本远多于taskB
taskA的低层次特征low level features有助于taskB

什么时候用多任务学习

多个任务有共性的低维特征；
每个任务的数据集数量多比较多，不会像迁移学习一样不平衡

卷积

三维卷积

如果输入不是二维灰度图，而是一个RGB图或者高维图像，那么过滤器也会有跟高维图像相同的维度。
比如图像是6x6x3，filter是3x3x3，那么得到4x4x1。

如果想学习多个不同的特征怎么办呢？

可以使用多个filter，每个filter关注不同的特性。以上面的例子为例，假如有n个filter，那么得到4x4xn的输出。

损失

二分类损失

Focal loss

二分类损失常用的是交叉熵损失，但是这不能解决正负样本不平衡的问题，因此出现了Focal loss，对于易于分类（分类概率越高）的样本乘以较小的权重，对于不易于分类的样本乘以较大的权重。
参考：https://blog.csdn.net/BIgHAo1/article/details/121783011

关注

8
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
深度学习基础

但是要注意：噪音背景需要和清晰的音频一样diverse，不能音频有1000条，噪音只有1条，要不然可能过拟合。为了能够使其适用于TaskB，需要对模型进行进一步训练，这个过程取决于taskB的样本数量。make similar的方法包括数据合成。比如含有噪音的音频。迁移学习是原本适用于taskA的模型同样应用在taskB。训练集和验证集的数据分布不同。模型没见过，没学习到；该方法在音频识别种效果很好。
复制链接

扫一扫

EEPI CSDN认证博客专家 CSDN认证企业博客

码龄4年

65: 原创

3万+: 周排名

3万+: 总排名

5万+: 访问

: 等级

1019: 积分

112: 粉丝

153: 获赞

31: 评论

291: 收藏

私信

关注

热门文章

分类专栏

自动驾驶大模型领域的论文精读笔记 21篇
ROS 2篇
python 3篇
仿真 2篇
自动驾驶 4篇
C++ 2篇
Ubuntu 2篇
C 1篇
AMESim 1篇
Matlab 1篇

最新评论

【论文精读】Fully Sparse 3D Occupancy Prediction
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【论文精读】Exploring the Causality of End-to-End Autonomous Driving
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【论文精读】Sparse4D v2: Recurrent Temporal Fusion with Sparse Model
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【论文精读】SparseDrive: End-to-End Autonomous Driving via Sparse Scene Representation
EEPI: 这篇论文得出的结论不止这一个，但是读者只看这一个就会有错误的印象。这篇论文认为，1场景过于简单2自车状态信息提示过多，导致MLP可以达到SOTA。但是从工业应用来看，场景会很复杂，比如无保护左转。所以从工业应用来看，暂时不能确定自车状态是好处多于坏处还是坏处多于好处。
【论文精读】SparseDrive: End-to-End Autonomous Driving via Sparse Scene Representation
EEPI: 这个逻辑我能理解，但是从我的经验出发较难认可。因为人开车的时候不可能不去了解当前车辆状态再去开，这样的端到端模型会导致未来模态过多，太多的模态导致闭环实车效果差——纵向顿挫，横向画龙，并不可取。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。