跑通YOLO方案baseline
YOLO简介:
YOLO(You Only Look Once)算法是一种快速、准确的目标检测算法,其基本思想是将目标检测任务转换为单次推断问题,通过一个统一的网络对图像中的目标进行识别和定位。
在YOLO算法中,输入图像首先被划分为网格(grid),每个网格单元负责预测固定数量的边界框(bounding box)以及这些边界框中的目标类别。每个网格单元通过共享卷积层来提取特征,并使用全连接层来预测边界框和类别概率。
本次赛事大要求是聚焦城市违规行为的智能检测,要求选手研究开发高效可靠的计算机视觉算法,提升违规行为检测识别的准确度,降低对大量人工的依赖,提升检测效果和效率,从而推动城市治理向更高效、更智能、更文明的方向发展,为居民创造一个安全、和谐、可持续的居住环境。
环境的配置上使用了GPU云主机4090中的mage-gpu-pytorch_20240807,通过jupyter notebook进行UI交互。