提升模型精度之加入先验知识

最新推荐文章于 2024-09-13 14:24:53 发布

xiaoxiaojuanji

最新推荐文章于 2024-09-13 14:24:53 发布

阅读量346

点赞数

文章标签：计算机视觉人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qwertyuiopwxwy/article/details/130312896

版权

1.前言

在很久之前看过一篇文章是写如何给模型加入先验知识，具体链接是给模型加入先验知识 - 知乎

那时候只觉得真妙啊，还能这样训练模型，并且很有道理的样子，不像其他对模型的改进方式（比如加注意力机制）这种玄学操作看命。今天重新看这篇文章时感受又加深了一些。于是想记录下来。

2. 具体做法

在这只介绍一些对二分类网络可以提升的先验知识。首先文章中举了一个栗子，说现在有个任务是要在所有的鸟类中识别出一种萌萌的鹦鹉，这种鹦鹉有一个非常强的特征就是不会飞。

按常规步骤我们应该是根据硬件需求寻找合适的图像分类网络，加载预训练模型把分类类别设成2就行。但仔细分析就会发现有几个潜在的问题：

1. 如果这种鹦鹉在外观上只有部分地方是具有区分性的，要么其实网络很难做出判断。

2. 世界上的鹦鹉其实有很多种，如果其他种的鹦鹉有一些特征特别强（比如有些种类脖子很长、有些种类嘴很大等)。而把他们都划分成一类和这种萌萌的鹦鹉区别开，这也有难度。

因此如何解决以上问题从而去改善一些badcase，

文章就提出，比如如果这种萌萌的鹦鹉的腿很长，那么就把腿单独的截出来，即把整个鸮鹦鹉和它的腿部作为一个网络的两路输入，在网络的后端再把两路输入的信息融合。这么做的目的其实就是让网络多学一点我们想要它注意到的特征。这其实和kaggle之前有个海豚细粒度分类是一样的，其中比赛方让大家注意海豚的脊部是一个很明显的区分点。但是这也有个缺点。模型两路输入太麻烦，而且增加的计算量让人感觉很不爽。文章又提出了可以让模型通过一个生成网络的支路来生成一个鸟类头部位置的Mask。个人觉得这个方法其实也比较麻烦。

然后就是第二个问题的解决，文章也提出了一个方法，虽然我没有去实践，但是个人感觉很有道理！（hhh) 就是引用一个自监督的方法来进行辅助学习，具体采用的是基于maxl[2]的方案（https://github.com/lorenmt/maxl）

还有一个点我们没有利用起这种萌萌的鹦鹉不会飞！，这就说明你不能通过背景来判断一只未知的鸟是鸮鹦鹉，但是你能通过背景来判断一只未知的鸟肯定不是鸮鹦鹉，所以假如说获取了一张输入图片的激活图(包含背景的)，那么这张激活图的鸟类身体部分肯定包含了鸮鹦鹉和其他鸟类的激活，但是鸟类身体外的背景部分只可能包含其他鸟类的激活。这些也是文章里的原话。具体解决方案是基于激活图，通过限制激活图的激活区域，加入目标先验。

3. 总结

个人觉得往模型中加入合适的先验知识就像kaggle比赛中做好数据的特征工程就成功了一半。只有仔细分析数据特性，对数据进行合理清洗，这才是训练好模型最好的前提。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

xiaoxiaojuanji CSDN认证博客专家 CSDN认证企业博客

码龄5年

8: 原创

154万+: 周排名

97万+: 总排名

3730: 访问

: 等级

95: 积分

315: 粉丝

10: 获赞

6: 评论

20: 收藏

私信

关注

热门文章

最新评论

水面目标检测提升精度之去除反射区域
qingqingaen: 请问您最后这个问题怎么解决的呢
水面目标检测提升精度之去除反射区域
qingqingaen: 博主你好请问你有更详细的步骤或者代码嘛
水面目标检测提升精度之去除反射区域
翰海锋刀: 你好，我想向你寻求一下帮助用于毕设，毕设涉及到了水面倒影的去除，但是按照你的四个步骤，没办法写出具体程序，可以将你的程序让我参考一下吗？邮箱 422216991@qq.com
kaggle Competition-Detect Player Contacts from Sensor and Video Data TOP 9%铜牌solo比赛经验
shape_of_wind: 非常感谢您的思路分享，这让我更加清晰了学习和了解了这场比赛，看到您的思路非常清晰和明了，直接看前几名的小白还有些吃力。如果方便的话可以看一下您的完整代码吗？（仅用于学习过程，不会任何侵权行为，小白也不知道这样是否合适，或者您在kaggle平台上看到有和您方案思路相同的code分享链接给我也很感谢）还想再看看您具体的比赛思路，和遇到的困难以及相关应对方法，再次非常感谢您的思路分享在我学习的路上给予了我很大的帮助
基础知识和小技巧
CSDN-Ada助手: 非常棒的博客，恭喜你写了第四篇！你的“基础知识和小技巧”这个主题很实用，对读者来说是非常有价值的。接下来，我建议你可以尝试写一些更深入的主题，例如某个具体技术的应用或者行业趋势的分析，这样可以吸引更多的读者，也可以让你拓展自己的知识面。期待你的下一篇博客！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。