深度学习——计算机视觉领域的应用

最新推荐文章于 2024-03-13 12:15:00 发布

zchang81

最新推荐文章于 2024-03-13 12:15:00 发布

阅读量4.3k

点赞数 1

分类专栏：深度学习文章标签：计算机视觉深度学习应用 cnn

本文链接：https://blog.csdn.net/zchang81/article/details/69539471

版权

深度学习专栏收录该内容

43 篇文章 4 订阅

订阅专栏

图像分类：
在2012年的ImageNet大赛上，Hinton和他的学生Alex使用cnn网络alexnet以超过第二名10%的成绩碾压第二名后，深度学习真正开始火热起来，从2012年的AlexNet（83.6%），到2013年的88.8%，再到2014年GoogLeNet的93.3%，最后到了2015年，微软提出的ResNet网络以96.43%的Top5正确率，达到了超过人类的水平（94.9%）的识别正确率。

物体检测：

图像检测是指在分类图像的同时把物体用矩形框给圈起来。从2014年到2016年，基于深度学习的检测框架先后出炉，基于候选区域的深度学习方法（R-CNN——>SPPnet——>Fast R-CNN——>Faster R-CNN）框架, 基于回归的Y深度学习方法（YOLO——>SSSD）框架，在PASCAL VOC数据集上的检测平均精度（mAP），检测精度从R-CNN的53.3%，到Fast RCNN的68.4%，再到Faster R-CNN的75.9%，最新实验显示，Faster RCNN + Resnet101可以达到83.8%。一张图片的检测速度从RCNN模型的2秒多，到Faster RCNN的198毫秒，再到YOLO的6.5毫秒（其缺陷是精度较低，只有52.7%），最后的SSD的43.5毫秒（精度75.1%）。