CNN------convolutional neural network 卷积神经网络
R-CNN 基于区域的卷积神经网络
contextual --前后关系
outperform 做的更好
generalizable---可概括的,可归纳的
leaky rectified 有纰漏的矫正
1,YOLO的核心思想是利用整张图像作为网络输入,在输出层回归bounding box 的位置和bounding box 的类别
2,之前的检测方法是使用proposal+classify的思想
3,YOLO的优点:速度快(把单个的组件整合,重复检测比较少),泛化能力强(在现实生活中和在艺术品中都可以应用),结构简单(仅使用单个神经网络)
YOLO的缺点:相邻很近的物体还有很小的物体检测的效果不是很好
同一类物体中出现的不常见的长宽比和其他情况时,泛化能力会弱一些
4,每个bounding box要预测(x,y,w,h)还有confidence这5个值,每一个网格还要预测一个类别信息,则SxS个网格,每个网格要预测B个bounding box还要预测C个categories。输出就是S x S x (5*B+C)的一个tensor。
5,
左边第一个是类别信息,第二三项是confidence。这个乘积即encode了预测的box属于某一类的概率,也有该box准确度的信息。
6,YOLO实现的具体细节
在各种损失函数中使用不同的权重。调节各方的平衡
7,将box中的w和h用平方根来代替
问题:
1,分类,如何实现的?
2,神经网络,如何应用的?
3,confidence的数值?
这个confidence代表了所预测的box中含有object的置信度和这个box预测的有多准两重信息,其值是这样计算的: