![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
计算机视觉
nathan_deep
Keep Learning, Keep Fighting
展开
-
YOLO v2 原理总结
论文地址:YOLO9000: Better, Faster, Stronger预测更准确(Better)1) Batch Normalization CNN在训练过程中网络每层输入的分布一直在改变, 会使训练过程难度加大,但可以通过normalize每层的输入解决这个问题。YOLO v2在每一个卷积层后添加batch normalization,通过这一方法,mAP获得了2%的提升。batch normalization 也有助于规范化模型,可以在舍弃dropout优化后依然不...原创 2020-05-09 15:00:03 · 865 阅读 · 0 评论 -
YOLO v1原理总结
论文原文:https://arxiv.org/pdf/1506.02640.pdf1 网络结构1)结构YOLO的结构非常简单,就是单纯的卷积、池化最后加了两层全连接。单看网络结构的话,和普通的CNN对象分类网络几乎没有本质的区别,最大的差异是最后输出层用线性函数做激活函数,因为需要预测bounding box的位置(数值型),而不仅仅是对象的概率。2)输入和输出的映射关系...原创 2020-05-07 14:55:59 · 500 阅读 · 0 评论 -
YOLO v3 原理总结
YOLO3主要的改进有:调整了网络结构;利用多尺度特征进行对象检测;对象分类用Logistic取代了softmax。新的网络结构Darknet-53在基本的图像特征提取方面,YOLO3采用了称之为Darknet-53的网络结构(含有53个卷积层),它借鉴了残差网络residual network的做法,在一些层之间设置了快捷链路(shortcut connections)。利...原创 2020-05-09 16:52:53 · 1107 阅读 · 0 评论 -
人脸识别mtcnn原理
人脸检测,也就是在图片中找到人脸的位置。输入是一张可能含有人脸的图片,输出是人脸位置的矩形框。人脸对齐。原始图片中人脸的姿态、位置可能有较大的区别,为了之后统一处理,要把人脸“摆正”。为此,需要检测人脸中的关键点(Landmark),如眼睛的位置、鼻子的位置、嘴巴的位置、脸的轮廓点等。根据这些关键点可以使用仿射变换将人脸统一校准,以尽量消除姿势不同带来的误差。MTCNN网络结构...原创 2020-01-04 14:11:54 · 1999 阅读 · 0 评论 -
非极大值抑制 nms
非极大值抑制(Non-max suppression)非极大值抑制,简称为NMS算法,英文为Non-Maximum Suppression。其思想是搜素局部最大值,抑制极大值。非极大值抑制,在计算机视觉任务中得到了广泛的应用,例如边缘检测、人脸检测、目标检测(DPM,YOLO,SSD,Faster R-CNN)等。目标检测的过程中在同一目标的位置上会产生大量的候选框,这些候选框相互之间可...原创 2019-10-09 17:32:04 · 424 阅读 · 0 评论