图像处理
文章平均质量分 56
xunan003
AI独角兽企业算法工程师
展开
-
YOLACT onnx前向推理,包括后处理出图
yolact的基于onnx的前向推理和基于numpy的后处理原创 2022-11-11 20:25:54 · 323 阅读 · 0 评论 -
近50个航空影像数据集
原文链接:https://www.cnblogs.com/jeshy/p/14793363.html1. UAVDT(Unmanned Aerial Vehicle Benchmark Object Detection and Tracking) https://sites.google.com/view/grli-uavdt/2. UA-DETRAC(UA-DETRAC is a challenging real-world multi-object detection and multi-obje转载 2021-07-26 16:40:17 · 3469 阅读 · 0 评论 -
python讀取和寫入caffe-ssd中lmdb data
原文:https://zhuanlan.zhihu.com/p/76318150lmdb是Cafffe中应用的一种数据库,采用内存-映射文件(memory-mapped files),拥有非常好的I/O性能,而AnnotatedDatum是caffe在LMDB数据库上保存数据的一种格式,主要用于SSD等目标检测模型训练数据的保存。在SSD-caffe的官方代码中(好像不算官方,是第三方实现的),模型训练是通过自定义层读取读取LMDB数据库文件进行数据导入的,而指定格式的LMDB数据则是通过两个脚本调转载 2020-06-30 13:42:45 · 285 阅读 · 0 评论 -
ubuntu終端打開圖片(系統自帶圖像閱讀器)
xdg-open meinv.jpg原创 2020-04-26 14:46:27 · 462 阅读 · 0 评论 -
YOLOv1、v2的caffe版本以及VGG-SSD、SqueezeNet-SSD、MobileNet-v1-SSD、MobileNet-v12-SSD、ShuffleNet-SSD具體實現
1、caffe下yolo系列的实现 1.1 caffe-yolo-v1我的github代码 点击打开链接参考代码 点击打开链接yolo-v1 darknet主页 点击打开链接上面的caffe版本较老。对新版的cudnn支持不好,可能编译出错,需要修改 cudnn.hpp头文件在次进行编译,修改后的cudnn.hpp文件,可在我的github主页找到。步骤:0、v...转载 2018-09-17 16:09:45 · 4076 阅读 · 0 评论 -
計算批量RGB圖像的均值
计算图像均值是图像预处理中的常见操作,计算机视觉中,深度学习框架输入图片后一般都会进行均值削减,分两种方法,一种是减去均值文件,另一种是生成RGB三个数值。第一种方法一般参考各自框架的API即可。第二种方法可以由简单的python代码得到,如下所示: import osimport cv2from numpy import *#img_dir='/home/zzy/ai_cha...转载 2018-09-25 17:00:08 · 1020 阅读 · 0 评论 -
选择性搜索
什么是选择性搜索? 选择性搜索是一种用于目标检测的区域推荐算法。它的设计速度快,召回率高。它是根据颜色、纹理、大小和形状的兼容性,计算相似区域的层次分组。 选择性搜索开始了基于利用图由Felzenszwalb和Huttenlocher分割方法的像素的图像分割。该算法的输出如下所示。右边的图像包含用纯色表示的分段区域。 我们可以在这个图像中使用分段部分作为区域建议吗...原创 2019-01-17 15:42:17 · 887 阅读 · 0 评论 -
普通max pooling反向传播与RoI max pooling反向传播解读
概述无论max pooling还是mean pooling,都没有需要学习的参数。因此,在卷积神经网络的训练中,Pooling层需要做的仅仅是将误差项传递到上一层,而没有梯度的计算。(1)max pooling层:对于max pooling,下一层的误差项的值会原封不动的传递到上一层对应区块中的最大值所对应的神经元,而其他神经元的误差项的值都是0;(2)mean pooling层:对于m...转载 2019-01-22 17:28:52 · 6880 阅读 · 1 评论 -
视频流编码格式(四字符码)对照表
最近在处理视频时遇到了一个问题就是摄像头拍摄的视频不够清晰,在查了许多文献之后发现视频质量和Opencv中库中的视频流编码方式息息相关。故将四字符编码器的对应信息总结如下。常用mp4或avi請參考:https://blog.csdn.net/zj360202/article/details/79026891FourCC Description 1978 A.M.Par...转载 2019-06-18 15:48:25 · 6119 阅读 · 0 评论 -
python cv2相关(持续更新)
1. 视频参数参数 propld 功能 cv2.CAP_PROP_POS_MSEC 0 视频文件的当前位置(以毫秒为单位)或视频捕获时间戳 cv2.CAP_PROP_POS_FRAMES 1 基于0的索引将被解码/捕获下一帧 cv2.CAP_PROP_POS_AVI_RATIO 2 视频文件的相对位置:0 - 视频的开始,1 -...原创 2019-06-18 15:57:22 · 877 阅读 · 0 评论 -
caffe.io.load_image与Opencv的imread区别
今天在写代码的时候遇到一个挺有趣的bug,我也是找了半天才查到资料解决的。bug描述如下:用训练好的caffemode做infernece(inference函数代码如下):#进行预测def inference(img, transformer, net, labelnames): #img = caffe.io.load_image(img_name, Tru...转载 2019-07-05 16:41:39 · 521 阅读 · 0 评论 -
关于YOLOv3转为caffemodel中一点问题
首先,我参考https://blog.csdn.net/Chen_yingpeng/article/details/80692018提供的yolov3_darknet2caffe.py脚本实现了darknet-yolov3到caffemodel的转化,得到了prototxt和caffemodel。但是,我在编译Chen提供的caffe-yolov3时,由于server上并没有sudo权限,也无...原创 2019-07-05 17:57:23 · 3829 阅读 · 1 评论 -
OpenCV图像缩放resize各种插值方式的比较
原文链接:https://blog.csdn.net/guyuealian/article/details/850976331. resize函数说明 OpenCV提供了resize函数来改变图像的大小,函数原型如下:void resize(InputArray src, OutputArray dst, Size dsize, double fx=0, double fy=0...转载 2019-07-24 15:57:47 · 2742 阅读 · 0 评论 -
imgaug数据增强库使用
imgaug是一个封装好的用来进行图像augmentation的python库,支持关键点(keypoint)和bounding box一起变换。项目主页: imgaug doc1. 安装和卸载# 通过github安装sudo pip install git+https://github.com/aleju/imgaug# 通过pypi安装sudo pip install img...转载 2019-09-18 11:39:57 · 1271 阅读 · 0 评论 -
windows7快速配置labelImg(强烈推荐python3.6)
由于windows下配置labelimg较ubuntu较为复杂,本文主要讲解windows下实现labelimg的快速配置,ubuntu系统下的配置可参考资料[1]。参考资料[1]也讲述了windows下labelimg的配置,个人认为有点繁琐,而且需要下载的文件比较大。本文实现配置需要下载资料少而且比较快。在此声明本文主要参考了资料[2],并结合自己的实操而成。配置过程主要要包括以下几个步骤...原创 2018-08-23 09:42:23 · 1931 阅读 · 1 评论 -
python-opencv实现缩放后以pad扩展
#coding=utf-8 import cv2 import numpy as np def ImageScale(img, scale): size = img.shape SIZE1 = size[0] SIZE2 = size[1] if scale > 1: size1 = int(SIZE1 *...转载 2018-05-16 18:49:15 · 1550 阅读 · 0 评论 -
训练好的caffemodel对图像进行批量测试并输出其TP、FN、TRP以及测试平均使用时间。
# coding=utf-8from __future__ import divisionimport osimport caffeimport numpy as np#import datetimeimport timeimport cv2root = '/home/x306/xn/caffe-master/'deploy = root + 'examples/facete...原创 2018-05-19 20:11:13 · 1560 阅读 · 0 评论 -
深度学习综述
深度学习综述1.深度学习深度学习是为了能够得到有助于理解图片、声音、文本等的数据所表述的意义而进行的多层次的表示和抽取的学习。例如,给定一张图片(包含许多黄色的郁金香), 大脑做出的反应是:“许多黄色的郁金香。”同样的图片,输入到计算机中,是描述图片的最原始数据,那就是用向量表示的像素. 用简单的机器学习,例如用含2个或3个隐含层的神经网络,是不可能达到与人类类似的判别决策转载 2017-03-27 21:21:18 · 1971 阅读 · 0 评论 -
ImageNet图片数据集下载地址
http://www.image-net.org/download.php原创 2017-05-09 19:50:31 · 15848 阅读 · 0 评论 -
基于深度学习的目标检测的研究进展2
原文链接:http://www.cnblogs.com/gujianhan/p/6035514.html 普通的深度学习监督算法主要是用来做分类,如图1(1)所示,分类的目标是要识别出图中所示是一只猫。而在ILSVRC(ImageNet Large Scale Visual Recognition Challenge)竞赛以及实际的应用中,还包括目标定位和目标检测等任务。其中目标转载 2017-06-30 20:59:32 · 1027 阅读 · 0 评论 -
python方法生成txt标签文件代码
1、如果想要利用代码(不论是python、c++、亦或是matlab)实现生成标签文件,首先,也是灰常重要的一件事就是你的图片集一定要是有规律的命名。数字字母顺序排开。这一点非常重要,相关重命名方法请自行百度或请教大牛。2、如图为博主的图片集。(注意命名规律)博主只分为猫和鸟两类。3、看代码。在caffe根目录下创建一个我们的工程目录my-caffe-project创建原创 2017-06-26 17:21:07 · 4911 阅读 · 1 评论 -
caffe可视化方法(21天实战caffe)python版
参考博文1:http://blog.csdn.net/qq_32166627/article/details/52640730赵老师的书第十六天可视化方法主要采用matlab接口方法实现,本篇博文采用python方法实现书中第十六天中实现的所有可视化。一、数据可视化1、mnist数据可视化 1)、训练样本可视化 首先要打开jupyter noteboo原创 2017-06-25 21:57:34 · 795 阅读 · 0 评论 -
目标检测标注工具labelImg使用方法
目标检测中,原始图片的标注过程是非常重要的,它的作用是在原始图像中标注目标物体位置并对每张图片生成相应的xml文件表示目标标准框的位置。然而博主转载的文章http://blog.csdn.net/u014696921/article/details/53353896中提到的标注工具虽然使用简单,但是无法在同一张图片中标注多个同类目标;并且其标注完成后只能生成对应的txt文件,需要借助一定的工具才能原创 2017-12-05 16:06:52 · 118242 阅读 · 11 评论 -
基于深度学习的风格迁移转换的两种实现——style-transfer和fast-neural-style-tensorflow
基于深度学习的风格迁移转换的两种实现——style-transfer和fast-neural-style-tensorflow转载 2017-12-07 11:20:09 · 3850 阅读 · 0 评论 -
Automatic fall detection of human in video using combination of features译文
Automatic fall detection of human in video using combination of features使用特征组合来自动检测视频中的人物KunWang, Guitao Cao*, Dan Meng, Weiting Chen, Wenming Cao+计算机科学与软件工程学院 华东师范大学 上海,中国200062通讯作者Email:gtcao@sei.ecnu.edu.cn+ 深圳大学信息工程学院 深圳 中国 518060+ 共同作者Email:wmca翻译 2017-12-16 16:55:39 · 3075 阅读 · 0 评论 -
常用公共数据集
CVonline:图像数据库(Google直译的结果,希望对大家有帮助)按主题索引行动数据库属性识别自主驾驶生物/医药相机校准脸和眼/虹膜数据库指纹一般图像一般RGBD和深度数据集一般视频手,掌握,手动和手势数据库图像,视频和形状数据库检索对象数据库人(静),人体姿势人员检测和跟踪数据库(另见监控)遥感场景或地点分割或分类分割同时本地化和映射监视和跟踪(另见人物)纹理城转载 2018-01-05 19:21:18 · 28453 阅读 · 1 评论 -
论文阅读笔记:图像分割方法deeplab以及Hole算法解析(diliation)
尊重原创,转载请注明:http://blog.csdn.net/tangwei2014deeplab发表在ICLR 2015上。论文下载地址:Semantic Image Segmentation with Deep Convolutional Nets and Fully Connected CRFS.deeplab方法概述 deeplab方法分为两步走,第一步仍然采用了FC转载 2018-02-02 14:39:54 · 583 阅读 · 0 评论 -
给定0-1矩阵求连通域
图像处理题目:注意,一下所有需要写代码的题目,不允许使用OpenCV的Mat类。如果图片内容需要用指针读取。1 . 给定0-1矩阵,求连通域。(遇到过N次,笔试面试都有,最好做到能徒手hack代码或者伪代码。) 二值图像分析最重要的方法就是连通区域标记,它是所有二值图像分析的基础,它通过对二值图像中白色像素(目标)的标记,让每个单独的连通区域形成一个被标识的块,进一步的我们就可以获取这些块的...转载 2018-05-06 15:31:56 · 6757 阅读 · 0 评论 -
python对图像数据增强,包括翻转、镜像、加噪。
import cv2import numpy as npimport os.pathimport copydef rotate(image, angle, center=None, scale=1.0): (h, w) = image.shape[:2] # If no rotation center is specified, the center of the im...原创 2018-05-19 20:02:48 · 19295 阅读 · 7 评论 -
python对双层目录下的图像数据进行规律重命名并重新调整图片大小(类似resize)
# -*- coding:utf-8 -*-import osfrom PIL import Imagepath = '/home/xn/caffe/examples/facetestquestions/ImageDatainc/'#Rename the picturedef rename(): j = 0 for image_class in os.listdir(...原创 2018-05-19 20:05:15 · 458 阅读 · 0 评论 -
图像处理之积分图应用二(快速边缘保留滤波算法)
图像处理之积分图应用二(快速边缘保留滤波算法)一:基本原理传统的图像边缘保留滤波算法-如高斯双边模糊、Mean-Shift模糊等计算复杂、效率比较低,虽然有各种手段优化或者快速计算方法,当时算法相对一般码农来说理解起来比较费劲,不是一个的选择,而通过积分图像实现局部均方差的边缘保留模糊算法,计算简单而且可以做到计算量跟半径无关、跟上面提到两种边缘保留滤波(EPF)算法效率高转载 2017-03-27 21:17:07 · 1578 阅读 · 0 评论