毫米波雷达网络研究五:孪生网络(Siamese Network)
论文名称:《Vehicle Detection With Automotive Radar Using Deep Learning on Range-Azimuth-Doppler Tensors》
LSTM网络(长短记忆网络)适合毫米波雷达原始数据的神经网络模型,该网络主要运用于语音信号,考虑到雷达信号与语音信号有一定相似性。但根据目前的阅读的资料以及与对这方面有一定了解的同学交流,由于雷达信号和语音信号仍有较大区别,因此基于LSTM网络获得的最终结果,不如时频变换、卡尔曼滤波器等方法所得出的精度高。
(1) 神经网络框架:全卷积神经网络和LSTM网络
(2) 测试集:论文作者通过将雷达安装在前保险杠上,摄像头安在车内实际测量的数据,一共有训练集共10.6万帧数据,时长2小时56分钟,测试集共5200帧,时长8分40秒
本篇论文主要是针对自主驾驶平台,重点研究了利用雷达张量进行目标检测。其中雷达张量即距离-多普勒-方位角,本文提出了一种模型处理三维张量,令雷达三维张量数据特征与图像特征相似,从而使用卷积神经网络进行训练。
本网络前部分是通过特征金字塔等经典的图像处理方法处理三维张量,将三维张量模型分成了3个二维特征提取特征金字塔,然后基于卷积神经网络进行特征提取,最终再讲提取后的特征输入LSTM网络中,避免了LSTM网络直接应用于毫米波雷达数据特征提取困难的问题。
网络研究六:基于无监督学习的深度跟踪
论文名称:《Unsupervised Deep Tracking》
方法概述:
(1) 神经网络框架:基于Siamese Network网络结构,子网络选用CNN网络;
(2) 训练方式:无监督学习和相关滤波;
(3) 训练集:ILSVRC 2015(大规模视觉识别竞赛所用数据集)
(4) 测试集:OTB2015(目前视觉目标跟踪领域主流的数据集,所有方法均会基于该数据集进行测试)、华为项目测试过程中记录的视频
创新点:
设计一种无监督学习的训练方式,利用未标记的数据或弱标记的数据进行模型训练;
缺陷:
训练数据json格式:
网络研究七:DeepSORT
论文名称:《Unsupervised Deep Tracking》
YOLO_V3:
近年来的视频目标跟踪算法均是依赖于tracking-by-detection的方式,即通过每帧均进行目标检测,帧间实现目标关联,因此自然需要目标检测和目标跟踪两个功能模块共同实现。
YOLO3是目前较为常用的目标检测网络,主要用于实时检测等场景中,在v1和v2两个版本上进行了改进。
方法概述:
deepSORT:
deepSORT算法中获取的是目标检测框出的图片,对目标检测框中的图片做特征提取,然后再在帧间做帧间匹配。
方法概述:
(1) 运动信息特征向量: