飞桨AI识虫竞赛直播讲解笔记（目标检测模型选择及调优等信息）

本文链接：https://blog.csdn.net/Ema1997/article/details/108275085

一、数据分析处理

数据增强方式：改亮度、对比度、饱和度，左右上下翻转，模糊，mixup（将多张图像融合在一张图像上）

二、模型设计与选择

Yolo系列
SSD
Faster R-CNN系列（其中faster rcnn最经典）
anchor-free方法，如cornerNet（直接找左上角和右下角的关键点来得知物体位置）

三、模型改进方法

1. backbone

A. 模型深度与宽度：ResNet block和Inception block
B. 并行连接高分辨率到低分辨率的特征图；重复用多尺度特征融合：HRNet

2. 特征融合

如FPN（特征金字塔）和ASPP（空洞卷积）

3. 损失

A. focal loss：参照Focal Loss for Dense Object Detection整体介绍及部分细节讲解
B. GIou：不用MSE、L1-smooth作为损失函数，而改用GIoU作为损失函数
$\frac{A\cap B}{A\cup B}$
$\ ( A ∪ B ) ∣ ∣ C ∣ GIoU = IoU-\frac {|C\backslash (A\cup B)|}{|C|}$
$L_{GIoU} = 1-GIoU$

四、注意事项

1. 防止梯度消失、梯度爆炸

A. 换激活函数 Relu→LRelu→PRelu
B. resnet block
C. BN
D. 梯度截断（clipping，防止梯度过大）：
$\lVert \hat{g}\rVert>threshold则\hat{g}=\frac{threshold}{\lVert\hat{g}\rVert}\hat{g}$
E. 预训练+微调

# paddlepaddle代码
train_parameters = {
	...
	"pretrained": True, # 是否使用预训练模型
	"pretrained_dir": "data/data11251/ResNet50_pretrained", # 预训练模型地址
	...
}
def load_params(exe, program):
	...
	elif train_parameters['pretrained'] and os.path.exists(train_parameters['pretrained_dir']):
		logger.info('load params from pretrained model')
		def if_exist(var):
			return os.path.exists(os.path.join(train_parameters['pretrained_dir'], var_name))
		fluid io.load_vars(exe, train_parameters['pretrained_dir'], main_program=program, 
							predicate=if_exist)