CNN: single-label to multi-label总结

最新推荐文章于 2021-03-23 16:34:28 发布

端坐的小王子

最新推荐文章于 2021-03-23 16:34:28 发布

阅读量6.6k

点赞数 1

分类专栏：其他文章标签： cnn multi-label

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012290039/article/details/38818405

版权

其他专栏收录该内容

5 篇文章 0 订阅

订阅专栏

1，概述

首次看多目标检测的文章。文中指出多目标检测有两个框架：1）BoW，2）DL。BoW还没看过。当然本文用的是DL中的CNN（好处多多）。

首先，这篇文章是在程明明提出BING以后的一次应用。本文提出了一种HCP的框架结构（Hypotheses-CNN-Pooling），检测方法是利用BING和HS提取提取hypotheses作为CNN的输入，每个hypotheses产生一个c维的预测结果，然后通过max pooling得到最终的多目标检测。

2，训练

HCP的框架结构与“Imagenetclassification with deep convolutional neural networks”提到的结构相似。

Shared cnn的训练分两个部分：

1）initializationof HCP

这一部分又分为两步：

第一步：pre-trainingon single-label image set

对整幅图片resize，pre-train,提取patches扔到CNN中去训练；

第二步：image-tine-tuningon multi-label image set

把整幅图片（没有crop）resize以后作为训练样本得到c维的预测结果pi = [pi1; pi2; :::pic]，label vecter为yi = [yi1; yi2;:::yic]，The ground-truth probability vector定义为，并利用loss function微调

作者提到这一步很关键（I-FT）,如果没有效果下降很明显。至于原因，3.2中有提到，多目标与单目标有很大的区别。

2）Hypotheses-fine-tuning

这一部分（H-FT）也很重要，因为对于去噪很关键。利用BING和HS得到的Hypotheses产生多个c维向量后max pool得到预测结果后利用第一部分第二步中的loss function微调

3，优点

1） nobounding box annotation 文中的训练采用的是label，costly少泛化能力高

2）去噪能力好（前面提到）。

3） Hypotheses数量任意，没有明确的标签要求。

4） Sharedcnn可以用single label imageset微调，解决多目标训练效率低的问题

5）输出即结果

端坐的小王子

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

端坐的小王子 CSDN认证博客专家 CSDN认证企业博客

码龄11年

32: 原创

7万+: 周排名

97万+: 总排名

8万+: 访问

: 等级

1303: 积分

69: 粉丝

123: 获赞

17: 评论

626: 收藏

私信

关注

热门文章

分类专栏

pyspark 2篇
推荐系统 21篇
NLP 6篇
机器学习 11篇
其他 5篇

最新评论

MCMC详解2——MCMC采样、M-H采样、Gibbs采样（附代码）
M855A1: 很显然本篇介绍充满了防自学设计，不但理论推导有错误，程序也是错误百出，根本就不对，要不是我真会我就点赞了
MCMC详解2——MCMC采样、M-H采样、Gibbs采样（附代码）
wycScott_better: 作者你好，文中给出的条件分布出错了，应该如下： $$ P(X_2 | x_1) = N(\mu_2 + \rho \sigma_2(x_1-\mu_1)/ \sigma_1, (1-\rho^2)\sigma_2^2) \\ P(X_1 | x_2) = N(\mu_1 + \rho \sigma_1(x_2-\mu_2)/ \sigma_2 , (1-\rho^2)\sigma_1^2) $$ 文中的条件分布x1，x2的结果完全颠倒了。（我深受其苦）希望作者尽快更正。（参见： https://blog.csdn.net/TonyShengTan/article/details/82947479）不过，作者文末的梳理我很赞！
循环神经网络RNN 2—— attention注意力机制（附代码）
小熊早睡觉: UP主写的很好哦！对我很有帮助
LDA主题模型2——文本建模与Gibbs采样求解
剑胆琴心76: 同求第三篇
推荐系统1——概述
东篱下の悠然: 博主，密码不正确

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。