2020-12-16

目标检测基础和VOC数据集

以分类角度看目标检测

对每个锚框进行分类,分类得分最高的框就代表检测最准确的框。

分类角度看目标检测

笔记

1.在train时一般设置shufle=True打乱数据顺序,增强模型的鲁棒性
2.num_worker表示读取数据时的线程数,一般根据自己设备配置确定(如果是windows系统,建议设默认值0,防止出错)
3.pin_memory,在计算机内存充足的时候设置为True可以加快内存中的tensor转换到GPU的速度
4.在pytorch中,图像的读取要使用Image.open()读取成PIL格式,不能使用opencv。由于Image.open()读取的图片是四通道的(RGBA),因此需要.convert(‘RGB’)转换为RGB通道。

image = Image.open(self.images[i], mode='r')
image = image.convert('RGB')

5.__getitem__读取一张图片及其objects信息,collate_fn将读取的一张张图片及其object信息整合成batch的形式。对于一个batch的images,collate_fn通过torch.stack()将其整合成4维tensor,对应的objects信息分别用一个list存储。
6.图片在送入网络训练之前需要进行归一化(对所有图片各通道求mean和std来获得),可以防止图片之间像素差异过大导致的训练不稳定问题。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值