计算机视觉和多媒体计算
文章平均质量分 91
yfraquelle
这个作者很懒,什么都没留下…
展开
-
全卷积网络FCN
原文链接:http://www.cnblogs.com/gujianhan/p/6030639.html背景CNN能够对图片进行分类,可是怎么样才能识别图片中特定部分的物体,在2015年之前还是一个世界难题。神经网络大神Jonathan Long发表了《Fully Convolutional Networks for Semantic Segmentation》在图像语义分割挖了一个坑,于...转载 2018-10-17 21:15:46 · 221 阅读 · 0 评论 -
MSCOCO数据集下载方法
MSCOCO数据集较大,可以使用Google gsutil工具搭配命令行下载sudo apt-get install aria2aria2c -c <url><url>即为官网下载地址train2017:http://images.cocodataset.org/zips/train2017.zipval2017:http://images.cocoda...原创 2018-10-24 20:19:10 · 9809 阅读 · 2 评论 -
FCN & CRF 论文笔记
原文链接:https://www.jianshu.com/p/434b3e22a47e本篇文章涉及4篇论文分别是Efficient Inference in Fully Connected CRFs with Gaussian Edge PotentialsConditional Random Fields as Recurrent Neural NetworksSEMANTIC ...转载 2018-11-03 18:25:28 · 2248 阅读 · 0 评论 -
Caffe的编译(匹配显卡计算能力)
环境:GTX1060(notebook) Ubuntu16.04-Desktop Anaconda3.0虚拟环境下的python2.7 CUDA8.0 CUDNN6.0由于编译安装OpenCV 3比较复杂,直接使用sudo apt-get install libopencv-dev 安装的2.4根据官方说明http://caffe.berkeleyvision.org/installati...原创 2018-12-21 17:09:18 · 1026 阅读 · 0 评论 -
释放异常占用的GPU内存
环境:Ubuntu16.04 GTX1060当使用GPU运行时发生内存错误可能导致异常退出而内存没有得到释放nvidia-smi可以查看GPU内存状态fuser -v /dev/nvidia* 查看占用GPU的进程kill -s 9 <pid>即可杀死异常进程...原创 2019-03-09 12:27:03 · 2559 阅读 · 4 评论 -
numpy数组精确保存为图片的方法
发现用cv2.write、scipy.misc.imsave、scipy.misc.toimage().save()保存都有细微的偏差,最终用PIL.Image.fromarrya().save()才能精确地将值保存下来参考链接:https://www.cnblogs.com/skyfsm/p/8276501.html...原创 2019-04-08 14:09:23 · 3329 阅读 · 6 评论 -
Pytorch GPU CUDA版本匹配
出现如下问题:Found GPU0 TITAN V which requires CUDA_VERSION >= 9000 for optimal performance and fast startup time, but your PyTorch was compiled with CUDA_VERSION 8000. Please install the correct PyTor...原创 2019-07-09 19:55:02 · 8799 阅读 · 1 评论 -
非极大值抑制 Non-Maximum Suppression,NMS
原文链接:https://www.cnblogs.com/makefile/p/nms.html概述非极大值抑制(),顾名思义就是抑制不是极大值的元素,可以理解为局部最大搜索。这个局部代表的是一个邻域,邻域有两个参数可变,一是邻域的维数,二是邻域的大小。这里不讨论通用的NMS算法(参考论文《Efficient Non-Maximum Suppression》对1维和2维数据的NMS实现...转载 2019-08-26 11:08:23 · 458 阅读 · 0 评论 -
认识Caffe与Caffe2
原文链接:https://www.cnblogs.com/carle-09/p/9033608.html目录:一、Caffe的作者-贾扬清二、Caffe简介--Caffe、Caffe2、Caffe2Go三、认识Caffe四、认识Caffe2五、认识Caffe2Go 正文:一、Caffe的作者-贾扬清Caffe 作者:贾扬清,任Facebook研究科学家...转载 2018-10-31 15:48:16 · 552 阅读 · 0 评论 -
安装SALICON(MSCOCO)api
Ubuntu16.04+Anaconda3的python2.7虚拟环境中安装saliconapi:pip install cythonpip install numpypip install scipypip install scikit-imagepip install matplotlibpip install pycocotoolsgit clone https:...原创 2018-10-29 15:20:45 · 854 阅读 · 0 评论 -
Image Caption简述
Image Caption(图片标注)就是从根据图片生成一句(段)描述文字。对于计算机来说,不仅需要检测出图像中的物体,还需要能理解物体之间的关系,并且需要结合一定自然语言处理的技术。一、方法Learning Phrase Representations using RNN Encoder–Decoder for Statistical Machine Translation中最初提出RN...原创 2018-10-07 11:36:17 · 3459 阅读 · 0 评论 -
scene graph(visual relation) 简述
场景图和视觉关系主要用于理解图像,可以作为caption、text2image、retrival的基础。基本思路是object detection加上Neural Motifs: Scene Graph Parsing with Global Contexthttps://rowanzellers.com/neuralmotifs/motif指场景图中重复出现的子结构。引入relation...原创 2018-10-08 16:33:27 · 8433 阅读 · 1 评论 -
计算机视觉四大基本任务(分类、定位、检测、分割)
原文链接:https://zhuanlan.zhihu.com/p/31727402引言深度学习目前已成为发展最快、最令人兴奋的机器学习领域之一,许多卓有建树的论文已经发表,而且已有很多高质量的开源深度学习框架可供使用。然而,论文通常非常简明扼要并假设读者已对深度学习有相当的理解,这使得初学者经常卡在一些概念的理解上,读论文似懂非懂,十分吃力。另一方面,即使有了简单易用的深度学习框架,如果...转载 2018-10-16 19:48:56 · 8149 阅读 · 3 评论 -
contextual modeling(semantic segmentation)简述
1.使用新的网络层做高层contextual aggregation《RefineNet: Multi-Path Refinement Networks for High-Resolution Semantic Segmentation》https://github.com/guosheng/refinenetResNet用于语义分割存在的问题是特征图是降采样的32倍,丢失了很多细节信...原创 2018-10-17 15:56:12 · 1189 阅读 · 0 评论 -
Object Detection 简述
本文对原文做了一些修改补充原文链接:https://blog.csdn.net/kbccs/article/details/80115060 目标检测一直是计算机视觉的基础问题,在 2010 年左右就开始停滞不前了。自 2013 年一篇论文的发表,目标检测从原始的传统手工提取特征方法变成了基于卷积神经网络的特征提取,从此一发不可收拾。本文将跟着历史的潮流,简要地探讨「目标检测」算法的两种思...转载 2018-10-17 20:35:34 · 380 阅读 · 0 评论 -
Ubuntu16.04安装Caffe2(GPU+CUDA9.0+CUDNN7+Anaconda3.0+python3.6)
Caffe2官网地址:https://caffe2.ai/docs/getting-started.html?platform=ubuntu&configuration=prebuilt创建虚拟环境,并激活:conda create -n caffe2-3.6 python=3.6source activate caffe2-3.6//按照官方说法可以支持cuda8.0和c...原创 2018-10-24 16:22:43 · 1781 阅读 · 2 评论 -
Attention Model in Visual Question Answering
注意力机制常常用于Visual Question Answering和Image Caption中,此篇主要介绍VQA中的注意力机制。《Recurrent Models of Visual Attention》https://github.com/jlindsey15/RAMhttps://github.com/kevinzakka/recurrent-visual-attention...原创 2018-10-22 17:01:42 · 684 阅读 · 0 评论 -
Object Tracking using OpenCV (C++/Python)(使用OpenCV进行目标跟踪)
原文链接:https://www.cnblogs.com/annie22wang/p/9366610.html本博客翻译搬运自https://www.learnopencv.com/object-tracking-using-opencv-cpp-python,用于初入目标跟踪的新手学习,转贴请注明!使用OpenCV进行目标跟踪(C++/Python)在本教程里,我们将学习OpenCV...转载 2019-08-30 17:02:13 · 492 阅读 · 1 评论