计算机视觉
文章平均质量分 82
Rosun_
风暖
展开
-
视觉常用数据集介绍和图像的常见操作
1.利用opencv进行图像读取处理保存import cv2import os,sysim_file=os.path.join('/home/dl','000004'+'.jpg')print(im_file)#read imageimg=cv2.imread(im_file)cv2.namedWindow("image")#process imagecv2.rectangle(img,原创 2017-09-20 22:27:43 · 1561 阅读 · 0 评论 -
Faster R-CNN:tf-faster-rcnn代码结构
Section 1: ./tf-faster-rcnn目录:├── data //数据目录主要保存一些数据集比如VOC2007、coco等│ ├── cache //保存一些数据集的训练集和测试集的proposals,比如voc_2007_test_gt_roidb.pkl,格式[{ },{ },...,{ }]。程序首先从这读取,如果文件存在原创 2017-10-04 17:37:25 · 5821 阅读 · 1 评论 -
经典卷积神经网络总结:LeNet-5、AlexNet、ZFNet、VGG、GoogleNet、ResNet
1.LeNet-5—-1989LeNet-5是卷积网络的开上鼻祖,它是用来识别手写邮政编码的,论文可以参考Haffner. Gradient-based learning applied to document recognition.大名鼎鼎的LeNet5诞生于1994年,是最早的深层卷积神经网络之一,并且推动了深度学习的发展。从1988年开始,在多次成功的迭代后,这项由Yann LeCun完成的原创 2016-11-12 23:00:19 · 11060 阅读 · 0 评论 -
Object Detection:R-CNN、Fast R-CNN、Faster R-CNN论文阅读笔记
1.引言Ross Girshick(rbg大神)2014年提出R-CNN架构,可谓给object detection领域一个里程碑的前进,在此之前object detection性能已经好些年没有大的提高了。本文是笔者阅读R-CNN系列文章的学习笔记。2.R-CNN部分2.1 R-CNN介绍R-CNN combines two key insights: (1) one can apply hig原创 2017-09-30 17:12:28 · 1608 阅读 · 0 评论 -
机器学习中的优化算法、加速训练机制、损失函数、KL散度和交叉熵
1.优化算法为了说明梯度下降法、随机梯度下降法、批量梯度下降法三者区别,我们通过一组数据来拟合 y=θ1∗x1+θ2∗x2 y = \theta_1*x_1 +\theta_2*x_2梯度下降(gradient descent):在梯度下降中,对于θθ的更新,所有的样本都有贡献,也就是所有样本参与调整θθ.其计算得到的是一个标准梯度。因而理论上来说一次更新的幅度是比较大的。如果样本不多的情况下,当原创 2016-11-17 16:59:51 · 3337 阅读 · 0 评论 -
Instance segmentation: MNC、FCIS、Mask R-CNN
Paper1:《Instance-aware Semantic Segmentation via Multi-task Network Cascades》本论文为CVPR16 arxiv:1512 Micorsoft Research Author:Jifeng Dai Kaiming He Jian Sun (1)提出Muti-task Network Cascades(多任务原创 2017-09-29 17:18:01 · 1914 阅读 · 0 评论 -
语义分割
IntroductionSemantic Segmentation:将图像中每个像素分配到某个对象类别。图像语义分割中存在3种挑战:(1)特征分辨率减少,(2)不同尺度下的物体的存在状况,(3)由于深度卷积神经网络的不变性造成的定位精度减少。第一个挑战是由 基于分类的卷积神经网络包含重复最大池化和降采样(步长跨度)操作造成的。深度卷积神经网络采用全卷积方式的时候,会明显降低特征地图的空间分辨率。原创 2017-09-27 10:32:22 · 6876 阅读 · 0 评论