深度学习之微调

最新推荐文章于 2024-07-10 22:17:05 发布

cunese0088

最新推荐文章于 2024-07-10 22:17:05 发布

阅读量1.2k

点赞数 1

文章标签：深度学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cunese0088/article/details/106099124

版权

微调流程：

在源数据集上预训练一个神经网络模型，即源模型
创建一个新的神经网络模型（目标模型）。它复制源模型上除了输出层外的所有模型设计与参数。假设这些模型参数包含了源数据集上学习到的知识，并且这些知识同样适用于目标数据集。

为什么不用源模型的输出层？ 它与源数据集的标签紧密相关，不用。

3. 为目标模型添加输出大小为目标数据集类别数的输出层，随机初始化该层的模型参数。

4. 在目标数据集上训练目标模型，从头训练输出层，其余层参数都基于源模型的参数微调得到。

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
深度学习之微调

微调流程：在源数据集上预训练一个神经网络模型，即源模型创建一个新的神经网络模型（目标模型）。它复制源模型上除了输出层外的所有模型设计与参数。假设这些模型参数包含了源数据集上学习到的知识，并且这些知识同样适用于目标数据集。为什么不用源模型的输出层？它与源数据集的标签紧密相关，不用。 3. 为目标模型添加输出大小为目标数据集类别数的输出层，随机初始化该层的模型参数。 4. 在目标数据集上训练目标模型，从头训练输出层，其余层的参数都是基于源模型的参数微调得到...
复制链接

扫一扫

cunese0088 CSDN认证博客专家 CSDN认证企业博客

码龄7年

12: 原创

21万+: 周排名

129万+: 总排名

9030: 访问

: 等级

230: 积分

4: 粉丝

7: 获赞

7: 评论

19: 收藏

私信

关注

热门文章

最新评论

立体匹配之端到端网络
Becky6655: 就是没有吧，都是用自己的算法在测试集上算EPE来比较
立体匹配DeepPruner求助
ctotalk: mark
关于PSMNet的困惑
cunese0088 回复「已注销」: 串联得到cost volume之后会经过3D卷积对这个特征比较丰富的量做处理，就相当于传统流程的代价聚合。因为最后也是用softmax转化为概率，所以称为代价也没什么问题，或者是负的代价。 GCNet中有负的，是因为卷积核学的结果吧。最后会用softmax转化为概率，这个概率不会是负的。代价可以是负值。所以不必把“代价”这个词看的很死，因为传统方法中一直是这样叫的。
关于PSMNet的困惑
「已注销」: 取了负数，
立体匹配之端到端网络
cunese0088 回复墨茶~: 我也没有找到呢

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。