【工作记录】有关预训练模型

最新推荐文章于 2024-06-12 23:52:02 发布

Monica_2020

最新推荐文章于 2024-06-12 23:52:02 发布

阅读量214

点赞数

分类专栏：工作记录文章标签：深度学习机器学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_34963978/article/details/121787288

版权

工作记录专栏收录该内容

1 篇文章 0 订阅

订阅专栏

【背景】
某3D回归任务，原问题是非常复杂的物理学加材料学的综合问题。数据集类似于点云，但是由于各个三维空间上的点的数据相互影响，所以单个数据的体积越大最后的预测效果就越好。
【网络结构】
3D-Unet+residual block.
【数据集描述】
数据集大小分别有25， 100， 200， 375四种，单个数据的结构为（1，3，96，96，96）。数据集制作不难，因此数量可随时增加。
在GPU为3070Ti，网络深度为6的情况下，batch size为2就提醒内存溢出。因此只能用CPU来训练模型
【预训练模型】
问题描述：网络上没有找到相对应的可用的预训练模型
（这或许只是因为自己没有找到）
初衷：用自己的模型来做预训练模型，考虑到即便是小的数据集，网络浅层参数也能充分学习到。因此先用小数据集将损失值下降到一定程度后，再用大数据集进一步训练网络模型。
【结果】

若预训练模型的数据集大于之后的新数据集，假设预训练的损失值截止在5左右（训练损失和验证损失相差不大）。那么用新数据集（内容无重合）继续训练时也会用5开始逐渐下降。
若预训练模型的数据集小于或近似于新数据集，那么无论之前已下降到了多少，用新数据集继续训练时损失值会从很大的值开始。

【结论于待验证】

是否预训练模型的数据集一定要大于新数据集才会有意义
是否预训练模型的结构一定要于自己的模型一致，使用预训练模型才有意义？
如果不同的预训练网络结构也可以用的话，要怎么使用呢？

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【工作记录】有关预训练模型

有关预训练模型的数据集大小和自己的数据集大小的关系
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。