1 前言
🚩 深度学习YOLO图像视频足球和人体检测
🥇学长这里给一个题目综合评分(每项满分5分)
- 难度系数:3分
- 工作量:3分
- 创新点:5分
选题指导,项目分享:
https://gitee.com/yaa-dc/warehouse-1/blob/master/python/README.md
1 课题背景
得益于深度学习技术的飞速发展,基于深度学习的目标检测算法研究成为近几年研究的热门方向。
本项目基于Yolov5算法实现图像视频足球和人检测。
2 实现效果
3 卷积神经网络
卷积神经网络(CNN)是一种包含卷积运算的深层前馈神经网络。传统的神经网络每个神经元权重连接上层的所有神经元,所以会出现大量权重值,增加整个网络的数据量和复杂程度。CNN则具有两个重要特征则是“局部感知”和“权值共享”,可有效提取数据的特征同时降低权值数量。完整的卷积网络通常包括卷积层、池化层、全连接层和输出层。
卷积神经网络的运行流程就是在卷积层进行特征提取,池化层进行进一步特征概括,最终通过全连接层进行分类的过程,流程见下图。根据数据的特征不同,卷积网络需要构建不同深度的网络结构,越复杂的数据越需要丰富的网络堆叠方式来提取数据的多层特征。
卷积层的提取数据特征的作用方式是通过卷积运算,使相同的卷积核根据固定的步长遍历数据。卷积核每遍历一个位置就和前一层中的神经元执行卷积运算,它是将矩阵中相同位置的元素直接相乘,然后求和的过程。在一维卷积神经网络中按照这个运算逻辑将卷积核矩阵根据步幅值继续向右滑动,直到覆盖整个输入矩阵,如图。
最后,得到卷积后的特征矩阵。在卷积层,输入由一组卷积核卷积得到新的特征映射经过激活函数处理传递至下一层。
池化层实现的功能则是对输入数据的降维和抽象,通过在空间范围内做维度约减,使模型可以抽取更广范围的特征,同时减少计算量和参数个数。池化采样主要分为两种方法:平均池化采样和最大池化采样。本文采用的是最大池化。池化过程如图。