base video detector
目前实现的有 detector、motion、aggregator三个组成部分。根据需求,motion和aggregator可以在detector内/外。
vid/base.py中从forward方法开始,依据是否 return_loss分别调用 forward_train和forward_test方法。forward_test方法中又根据是否要增强测试来调用simple_test和aug_test
方法。
其他视频检测器继承BaseVideoDetector,并重写 forward_train 和 simple_test 方法。
此外base中还有:
- _parse_losses: 进行loss解析,返回 loss 和 要记录的log
- show_result: 将检测结果det_bboxes绘制到img上。det_bboxes:shape为[num_classes, 5], [tl_x, tl_y, br_x, br_y, score]。调用 mmcv.imshow_det_bboxes
- train_step
- val_step