**1.方法:**本研究提出了一种在夜间检测红外闭路电视图像中的人准确有效的方法。基于CNN的像素级分类器用于细粒度实施人员检测。为了实现在夜间对CCTV图像中的人进行远程监视的目的
2.数据集:
“University”数据集是使用红外(FLIR)相机从大学校园的行人桥顶部拍摄的,用于在明亮的城市地区从头顶的角度对夜间人体检测的性能进行基准测试
“beach”和“shore”数据集是使用红外CCTV从韩国公共海滩旁边的建筑物的屋顶获取的,用于实际评估人类检测夜间溺水预防,由于相机远离场景,因此感兴趣区域仅构成图像中的一个小区域。其他具有挑战性的因素包括来自海浪的噪音和来自海浪的不规则照明周围的建筑物。为了部分克服这些问题,原始图像被裁剪为仅包含感兴趣的区域,即靠近海滩的海域。为此,只有人侵入水域的人被检测到,而海滩上的人没有被检测到
**3.网络结构:**本研究使用专为语义图像分割任务而设计的CNN。该架构有一个ResNet的基础网络和具有atrous 卷积的顶层。网络接受NN3的输入 图像并输出N*N个像素级label。其中三个输入通道取自(i)原始红外图像,(ii)与前一帧的差异图像,(iii)背景减法掩模。
这使得网络在进行预测时也能够捕获时间信息。使用交叉熵损失对网络进行二元分类任务的训练。网络的输出是每个像素的二维置信度分数阵列。用0.99的检测阈值过滤阵列以创建二进制掩模。检测阈值的高水平用于确保检测结果中的噪声被充分滤除。为了确定实际人数,连接组件算法用于在二进制掩模中将相邻像素合并在一起以形成单个对象。该网络共训练了150个ep