1. 3个常见目标
3个目标分别是图像分类,目标检测和图像分割。图像分类的模型非常多,结构也多变,包括vgg、inception、resnet、mobilenet、SENet等。目标检测的模型包括Yolo系列以及两阶段系列,比如 SSD、FPN、RetinaNet、Faster rcnn、AnchorFree、Transformer等。图像分割的模型包括Mask-RCNN,Unet系列,deeplab系列,FCN、SegNet、BiSeNet等。3个任务的模型相辅相依,互相吸取对方的优点和创新点,互相成长。
2. 目标检测
Yolo是只看一次的模型,经历了从v1 – v8的层层迭代,已经是图像项目中的必知必会的模型,在目标检测的任务中精度和速度表现非常好,是值得学习的一个模型。其中yolov4是改进较大的一个版本,改进了SAM和PAN的结构,使得yolo系列得以在工业界广泛使用。今天的yolo已经发展到了v8版本,未来会不会有v9, v10呢?
虽然yolo用的比较多,但是笔者还是建议多去看看其他模型,以及那些被很少使用或者快被遗忘的模型,比如SSD, RetiaNet等等,了解他们的大概架构以及思想,会对今天所使用的模型有着更完整的理解。
3. 工程使用
大部分的使用场景是拿当前业务的数据集train这些已有的模型,所以重点不在模型上,在数据标注、数据扩增上,大概会花费80%的时间,所以在工程使用中自