RACNN源代码来自: https://github.com/klrc/RACNN-pytorch
论文内容
创新点:
- 提出注意力建议子网(APN)
优势:
不需要边界框注释
实现细粒度特征学习
认为区域检测和细粒度特征学习是相互关联的,因此可以彼此增强。
通过交替学习每个尺度上的软最大分类损失和相邻尺度上的成对排序损失,对所提出的RA-CNN进行了收敛优化
受区域建议网络(RPN,用在Fast RCNN中)启发。
每个尺度网络具有两个输出:
- 概率分布p
- 为下一更精细的尺度预测Bounding Box坐标
我的数据集形式
二分类数据集,分为train test validaton三个子文件夹,每个子文件夹又分为两个文件,分别存放一类图片,如下图所示
getitem
dataloader其实是得到自定义的dataset类的 __getitem
方法的返回值,即图片和该图片的类别
def __getitem__(self, index):
img = cv2.imread(self._imgpath[index])
img = self.transform(img)
cls = self._imglabel[index]
return img, cls