2017年06月_zchang81

原创 TensorFlow1.2.0版主要变化

TensorFlow1.2.0版主要变化

2017-06-30 16:39:37 1991

原创 pva-faster-rcnn编译cpu版本的错误

pva-faster-rcnn编译cpu版本，在编译caffe的时候，遇到如下问题的解决办法

2017-06-28 10:26:13 1083 2

原创 caffe命令及其参数解析

caffe命令及其参数解析：caffe <command> <args>

2017-06-27 14:36:14 879

原创目标检测的papers、github地址及pascal voc排名

对象检测（Object Detection）最全的资料

2017-06-25 07:46:22 2943

原创 pva-faster-rcnn训练过程介绍

pva-faster-rcnn是在py-faster-rcnn的基础之上，把cnn部分修改为pvanet网络。PVANET是目前目标检测算法比较好的实现，也是Region Proposal系列方法的一个新实现，目前达到了real-time的单张图像50ms，压缩后的模型达到了real-time的单张图像30ms

2017-06-24 21:07:30 2134

原创 caffe中nvcc编译目标GPU指令集的命令选项

nvcc编译目标GPU指令集的命令选项

2017-06-24 20:45:50 1361

转载 Caffe2：移动计算的深度学习框架

Caffe2是Facebook新的开源深度学习框架。与之前的PyTorch不同，Caffe2专门用于将深度学习移植到移动应用程序中，这将会让智能手机更“深入”、更智能!

2017-06-21 18:09:51 2198

转载 OPenCV 图像拼接之------stitching和stitching_detailed

Stitcher类与detail命名空间OpenCV提供了高级别的函数封装在Stitcher类中，使用很方便，不用考虑太多的细节。低级别函数封装在detail命名空间中，展示了opencv算法实现的很多步骤和细节，使熟悉如下拼接流水线的用户，方便自己定制。可见OpenCV图像拼接模块的实现是十分精密和复杂的，拼接的结果很完善，但同时也是费时的，完全不能够实现实时应用。我在研究detail源码时，由...

2017-06-21 09:09:43 3812 4

原创 caffe2 安装

caffe2 安装过程

2017-06-20 09:22:43 993

翻译 HyperNet: Towards Accurate Region Proposal Generation and Joint Object Detection

本文是region-based object detection framework。相比与faster rcnn，hypernet更擅长处理小物体，并且产生更高质量的proposal。整体的框架见下图：

2017-06-19 11:12:36 582

转载 PVANET: Deep but Lightweight Neural Networks for Real-time Object Detection

1.实现了高精确度的多类目标检测任务同时通过调整和结合最近的技术创新达到最小化计算cost的目标 2.使用" CNN feature extraction + region proposal + RoI classification"的结构，主要对feature extraction(特征提取)进行重新设计。因为，region proposal部分计算量不太大而且classification部分可以使用通用的技术（例如：truncated SVD）进行有效的压缩。 3.设计原则：less

2017-06-19 10:04:25 838

转载 PVANET 网络

旨在降低计算量，重新设计了特征提取部分，设计原则是“通道少层数多”，网络比较深但是比较瘦，使用了batch norm，residual 连接，学习率更新策略等技术。在VOC2012上 rank-2，运行时间在i7-6700K CPU上750ms/帧，在Titan X GPU上运行时间45ms/帧。

2017-06-19 10:01:23 1013

转载 KITTI数据集简介与使用

KITTI数据集由德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合创办，是目前国际上最大的自动驾驶场景下的计算机视觉算法评测数据集。该数据集用于评测立体图像(stereo)，光流(optical flow)，视觉测距(visual odometry)，3D物体检测(object detection)和3D跟踪(tracking)等计算机视觉技术在车载环境下的性能。

2017-06-19 09:34:33 6382

转载合成全景图中计算机视觉技术的知识和原理

合成全景图中计算机视觉技术的知识和原理

2017-06-19 09:20:25 1630

转载图像拼接原理与相关技术

所谓图像拼接就是考虑如何将多幅来自同一场景的有重叠区域的小尺寸图像合成一幅大尺寸的高质量的图像。这种技术为图像降噪、视场（Field of view）扩展、背景场景构建（运动物体去除）、去模糊、空间分辨率的提高和动态范围的增强提供了更佳的策略。同样，图像拼接也应用于图像恢复、计算机特效、图像压缩与视频编辑等领域。

2017-06-19 09:18:50 3582

转载图像拼接之转透视矩阵

在图像拼接领域中，透视矩阵起着至关重要的作用，网络上关于这一知识的介绍已经很多，本人在此稍加总结和归纳一下，也方便自己今后查找一些结论性的要点（别人的再怎么好，还是自己的看起来舒服：）），接下来，就让我们对透视矩阵做一番深入性的认识吧。

2017-06-18 09:52:00 7251 4

转载图像拼接技术步骤归纳

图像拼接也是计算机视觉领域的一个研究热点，本人这段时间内也对该算法进行了一番研究，在这里把其思想步骤简单归纳总结一下，以免忘记。

2017-06-18 09:47:32 15224 4

原创 Imagenet数据集

MNIST将初学者领进了深度学习领域，而Imagenet数据集对深度学习的浪潮起了巨大的推动作用。深度学习领域大牛Hinton在2012年发表的论文《ImageNet Classification with Deep Convolutional Neural Networks》在计算机视觉领域带来了一场“革命”，此论文的工作正是基于Imagenet数据集。

2017-06-17 22:53:18 48847 1

原创 COCO 数据集

COCO数据集是微软团队获取的一个可以用来图像recognition+segmentation+captioning 数据集.

2017-06-17 22:49:04 10066

原创 PASCAL VOC 数据集

PASCAL VOC为图像识别和分类提供了一整套标准化的优秀的数据集，从2005年到2012年每年都会举行一场图像识别challenge。

2017-06-17 22:44:26 5398

转载谷歌开源TensorFlow Object Detection API物体识别系统

近日，谷歌在其开源博客上发表了一篇名为《Supercharge your Computer Vision models with the TensorFlow Object Detection API》的文章，通过 TensorFlow Object Detection API 将谷歌内部使用的物体识别系统（2016 年 10 月，该系统在 COCO 识别挑战中名列第一）开源给更大的社区，帮助打造更好的计算机视觉模型。机器之心对该文进行了编译，原文链接请见文末。

2017-06-16 16:53:26 8608

原创谷歌开源移动端视觉识别模型：MobileNet

近日谷歌发布了 MobileNet 网络架构，它是一系列在 TensorFlow 上高效、小尺寸的移动优先型视觉模型，其旨在充分利用移动设备和嵌入式应用的有限的资源，有效地最大化模型的准确性。MobileNet 是小型、低延迟、低功耗的参数化模型，它可以满足有限资源下的各种应用案例。它们可以像其他流行的大规模模型（如 Inception）一样用于分类、检测、嵌入和分割任务等。

2017-06-16 09:08:16 12238 1

原创 OpenCV进行图像相似度对比的几种办法

OpenCV进行图像相似度对比的三种办法

2017-06-15 10:14:53 59103

原创 opencvn的模板匹配方法

模板匹配是一种在图像中定位目标的方法，通过把输入图像在实际图像上逐像素点滑动，计算特征相似性，以此来判断当前滑块图像所在位置是目标图像的概率

2017-06-15 10:10:39 845

转载 Deep Learning的推荐学习资源

Deep Learning的推荐学习资源

2017-06-14 18:18:12 668

转载微软发布可变形卷积网络代码：可用于多种复杂视觉任务

上个月，微软代季峰等研究者发布的一篇论文提出了一种可变形卷积网络，79生活库http://www.7999s.com，该研究「引入了两种新的模块来提高卷积神经网络（CNN）对变换的建模能力，即可变形卷积（deformable convolution）和可变形兴趣区域池化（deformable ROI pooling）」

2017-06-14 18:02:52 2823 2

转载卷积神经网络中图像池化操作全解析

卷积层是对图像的一个邻域进行卷积得到图像的邻域特征，亚采样层（池化层）就是使用pooling技术将小邻域内的特征点整合得到新的特征。　　在完成卷积特征提取之后，对于每一个隐藏单元，它都提取到 (r-a+1)×(c-b+1)个特征，把它看做一个矩阵，并在这个矩阵上划分出几个不重合的区域，然后在每个区域上计算该区域内特征的均值或最大值，然后用这些均值或最大值参与后续的训练，这个过程就是池化。

2017-06-14 06:55:41 2510

转载计算机视觉识别简史：从 AlexNet、ResNet 到 Mask RCNN

最近，物体识别已经成为计算机视觉和 AI 最令人激动的领域之一。即时地识别出场景中所有的物体的能力似乎已经不再是秘密。随着卷积神经网络架构的发展，以及大型训练数据集和高级计算技术的支持，计算机现在可以在某些特定设置（例如人脸识别）的任务中超越人类的识别能力。

2017-06-13 21:46:04 3350

转载 R-FCN+ResNet-50用自己的数据集训练模型(python版本)

R-FCN+ResNet-50用自己的数据集训练模型(python版本)

2017-06-13 21:18:43 1881

原创 py-faster-rcnn训练脚本faster_rcnn_end2end.sh分析

py-faster-rcnn训练脚本faster_rcnn_end2end.sh分析

2017-06-13 17:35:00 3623 2

转载 Faster R-CNN 深入理解 && 改进方法汇总

Faster R-CNN 从2015年底至今已经有接近两年了，但依旧还是Object Detection领域的主流框架之一，虽然推出了后续 R-FCN，Mask R-CNN 等改进框架，但基本结构变化不大。同时不乏有SSD，YOLO等骨骼清奇的新作，但精度上依然以Faster R-CNN为最好。对于一般的通用检测问题（例如行人检测，车辆检测，文字检测），只需在ImageNet pre-train model上进行若干次 fine-tune，就能得到非常好的效果。

2017-06-13 14:09:35 37441 15