(1)将输入图像resize 到;
(2)运行一个简单的卷积网络对输入图像进行处理;
(3)对模型输出confidence进行阈值处理得到检测结果;
相比较于其他实时系统,yolo可以实现大于两倍的平均精度.与其他采用话筒窗口获得区域的技术不同,yolo在训练,测试的时候,对整个图像进行处理,因此它可以获得物体的类别和外貌等信息.
网络结构为:
最后一层采用一个线性激活函数,其他层采用leaky rectified 线性激活函数,
(1)将输入图像resize 到;
(2)运行一个简单的卷积网络对输入图像进行处理;
(3)对模型输出confidence进行阈值处理得到检测结果;
相比较于其他实时系统,yolo可以实现大于两倍的平均精度.与其他采用话筒窗口获得区域的技术不同,yolo在训练,测试的时候,对整个图像进行处理,因此它可以获得物体的类别和外貌等信息.
最后一层采用一个线性激活函数,其他层采用leaky rectified 线性激活函数,