图像处理
_123杨子江
这个作者很懒,什么都没留下…
展开
-
来聊聊DenseNet及其变体PeleeNet、VoVNet
class _DenseLayer(nn.Sequential): """Basic unit of DenseBlock (using bottleneck layer) """ def __init__(self, num_input_features, growth_rate, bn_size, drop_rate): super(_DenseLayer, self).__init__() self.add_module("no...转载 2020-05-21 20:46:36 · 563 阅读 · 0 评论 -
OpenCV读取TXT文件并生成RGB后再转成HSV
参考博客1:使用Opencv将RGB颜色空间转换到HSV颜色空间/灰度图参考博客2:c++ opencv保存图片参考博客3:【OpenCV】访问Mat中每个像素的值(新)参考博客4:opencv图像IplImage的创建保存参考博客5:c++从txt文件中读取数据#include <opencv2/opencv.hpp>#include<vector>#inc...原创 2020-04-27 00:34:00 · 607 阅读 · 1 评论 -
YOLOv4
paper:https://arxiv.org/pdf/2004.10934.pdf,code:https://github.com/AlexeyAB/darknet核心中的核心:作者将Weighted-Residual-Connections(WRC), Cross-Stage-Partial-connections(CSP), Cross mini-Batch Normalization...转载 2020-04-25 21:55:03 · 2982 阅读 · 0 评论 -
论文:Moving segmentation in HEVC compressed domain based on logistic regression2017
两年前看的压缩域文章,论文地址(IEEE):Moving segmentation in HEVC compressed domain based on logistic regression2017本文所提出的移动分割方法使用离线训练方案来获得一组最佳系数。在分割过程中,首先对从HEVC流中提取的语法元素进行预处理,形成特征向量,然后对每个4×4块进行归一化。其次,逻辑回归分类器对输入特征应...原创 2020-04-11 12:38:33 · 197 阅读 · 0 评论 -
论文:PolarMask: Single Shot Instance Segmentation with Polar Representation
这是我很久之前看的一篇文章,论文地址【入口】,知乎上也有人讲这个【实例分割:PolarMask】,文章开源GitHub上自行搜索;最开始在【 PolarMask: 一阶段实例分割新思路 】上面看到PolarMask: Single Shot Instance Segmentation with Polar RepresentationPolarMask:单镜头实例分割与极坐标表示https:...原创 2020-04-11 12:23:00 · 790 阅读 · 0 评论 -
高斯滤波
滤波算法简介图像处理中,常用的滤波算法有均值滤波、中值滤波以及高斯滤波等。均值滤波使用模板内所有像素的平均值代替模板中心像素灰度值,这种方法易收到噪声的干扰,不能完全消除噪声,只能相对减弱噪声;中值滤波计算模板内所有像素中的中值,并用所计算出来的中值体改模板中心像素的灰度值,这种方法对噪声不是那么敏感,能够较好的消除椒盐噪声,但是容易导致图像的不连续性。高斯滤波对图像邻域内像素进行平滑时,邻域内...转载 2020-03-19 12:10:21 · 541 阅读 · 0 评论 -
目标检测和感受野的总结和想法
以下内容整理自:zhihu@YaqiLYUhttps://zhuanlan.zhihu.com/p/44106492Tensorflow:https://github.com/google-research/receptive_field/Pytorch:https://github.com/Fangyh09/pytorch-receptive-field以上的...转载 2020-03-15 16:15:36 · 233 阅读 · 0 评论 -
论文:Moving Object Detection in HEVC Video by Frame Sub-sampling
这是我很久之前看的一篇文章,内容挺简单的,好复现。可以在arxiv上找找看。摘要Abstract—Video compression aims to remove spatial-temporal redundancies where the encoded bitstream, particu-larly the motion vectors, may not represent th...原创 2020-03-05 17:46:29 · 294 阅读 · 0 评论 -
目标检测和感受野的总结和想法
以上就是不同层下的不同的感受野。以下内容整理自:zhihu@YaqiLYUhttps://zhuanlan.zhihu.com/p/44106492PS:提供一下pytorch和tensorflow计算感受野的库:Tensorflow:https://github.com/google-research/receptive_field/Pytorch:https://g...转载 2020-03-01 15:15:53 · 225 阅读 · 0 评论 -
OpenCV—边缘检测(Canny算子,Sobel算子,Laplace算子,Scharr滤波)
有点偷懒,凑合着看吧//添加头文件#include<opencv2/core/core.hpp>#include<opencv2/highgui.hpp>#include<opencv2/imgproc.hpp>#include<iostream> using namespace std;using namespace...转载 2020-03-01 11:40:25 · 194 阅读 · 0 评论 -
HOF与MBH
两个传统的图像处理特征,简单有用。1.HoF(Histogram of Flow)1)概念HOF(Histograms of Oriented Optical Flow)是计算光流方向的直方图,和HoG一个概念,通常用于Action Recogntion中。2)提出原因一方面,光流对于运动方向,背景变化敏感。另一方面,在动作识别中,相应的光流特征描述子的维度在变化。于是,需要寻找一个基于...翻译 2020-01-16 17:15:47 · 1268 阅读 · 0 评论 -
Fisher Vector
翻译 2020-01-16 14:37:54 · 143 阅读 · 0 评论 -
论文:Faster RCNN
经过R-CNN和Fast RCNN的积淀,Ross B. Girshick在2016年提出了新的Faster RCNN,在结构上,Faster RCNN已经将特征抽取(feature extraction),proposal提取,bounding box regression(rect refine),classification都整合在了一个网络中,使得综合性能有较大提高,在检测速度方面尤为明显...转载 2020-01-11 13:43:07 · 391 阅读 · 0 评论 -
高斯混合模型(GMM)
混合模型(Mixture Model)混合模型是一个可以用来表示在总体分布(distribution)中含有 K 个子分布的概率模型,换句话说,混合模型表示了观测数据在总体中的概率分布,它是一个由 K 个子分布组成的混合分布。混合模型不要求观测数据提供关于子分布的信息,来计算观测数据在总体分布中的概率。高斯模型单高斯模型当样本数据 X 是一维数据(Univariate)时,高斯分布遵从下...转载 2019-11-13 11:33:50 · 682 阅读 · 0 评论 -
论文:(DenseNet)Densely Connected Convolutional Networks
 论文链接:https://arxiv.org/pdf/1608.06993.pdf代码的github链接:https://github.com/liuzhuang13/DenseNetMXNet版本代码(有ImageNet预训练模型): https://github.com/miraclewkf/DenseNet文章详解: ...转载 2019-10-31 15:41:36 · 199 阅读 · 0 评论 -
简单理解Sift中尺度空间、高斯金字塔、差分金字塔(DOG金字塔)、图像金字塔
SIFT,即尺度不变特征变换(Scale-invariant feature transform,SIFT),是用于图像处理领域的一种描述。这种描述具有尺度不变性,可在图像中检测出关键点,是一种局部特征描述子。 该方法于1999年由David Lowe 首先发表于计算机视觉国际会议(International Conference on Computer Vision,ICCV),2004年再...翻译 2019-10-31 12:56:08 · 1260 阅读 · 0 评论 -
论文:Gaussian YOLOv3: An Accurate and Fast Object Detector Using Localization Uncertainty for Autonomo
 最近发现了好多基于YOLO修改的网络,一般都是‘剪枝’,已达到轻量级的目的 在目标检测的落地项目中,实时性和精确性的trade-off至关重要,而YOLOv3是目前为止在这方面做得最好的算法。本文通过高斯分布的特性,改进YOLOv3使得网络能够输出每个检测框的不确定性,从而提升了网络的精度。...转载 2019-10-31 11:16:55 · 3898 阅读 · 3 评论 -
benchmark和baseline
 作者:Anonymous链接:https://www.zhihu.com/question/28823373/answer/101504099来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。Benchmark和baseline都有性能比较的意思。先看看字典定义。benchmark:N-COUNT A benchmark is some...转载 2019-10-26 16:23:40 · 196 阅读 · 0 评论 -
RPN(Region Proposal Network)
RPN全称是Region Proposal Network,Region Proposal的中文意思是“区域选取”,也就是“提取候选框”的意思,所以RPN就是用来提取候选框的网络; 1. RPN的意义 RPN第一次出现在世人眼中是在Faster RCNN这个结构中,专门用来提取候选框,在RCNN和...转载 2019-10-24 19:04:46 · 1872 阅读 · 0 评论 -
Depthwise卷积与Pointwise卷积
Depthwise(DW)卷积与Pointwise(PW)卷积,合起来被称作Depthwise Separable Convolution(参见Google的Xception),该结构和常规卷积操作类似,可用来提取特征,但相比于常规卷积操作,其参数量和运算成本较低。所以在一些轻量级网络中会碰到这种结构如MobileNet。常规卷积操作对于一张5×5像素、三通道彩色输入图片(shape为5×5×...转载 2019-10-24 18:55:07 · 589 阅读 · 0 评论 -
论文:YOLO Nano: a Highly Compact You Only Look OnceConvolutional Neural Network for Object Detection
链接:https://arxiv.org/abs/1910.01271希望作者能在不久后开源!文章目录从两阶段目标检测开始的故事YOLO Nano 设计思路YOLO Nano 架构设计实验效果目标检测在计算机视觉领域是一个活跃的研究分支,而深度学习已经成为这一领域最前沿也是最成功的解决方案。但是,在边缘和移动设备中广泛部署神经网络模型需要大量的计算算力和内存。因此,近来研究领域主要在解决适...转载 2019-10-12 10:46:46 · 1636 阅读 · 3 评论 -
论文:Accel A Corrective Fusion Network forEfficient Semantic Segmentation on Video
这是一篇2019CVPR的文章,也是我几个月前看的,有人说这篇文章有点水。原创 2019-10-23 10:20:01 · 747 阅读 · 0 评论 -
论文:Fast Semantic Segmentation on Video Using Block Motion-Based Feature Interpolation
这是一篇2018ECCV的文章,几个月前看过了,老规矩先放这里,有空慢慢补上!原创 2019-10-23 10:18:01 · 291 阅读 · 1 评论 -
论文:Fast Panoptic Segmentation Network
论文链接:https://arxiv.org/pdf/1910.03892.pdf  在论文中,研究者介绍了这种名为 FPSNet 的全景分割网络。它无需计算成本极高的实例掩码预测或融合启发算法,而是通过将全景任务转换为自定义的像素级密集分类任务来实现,该任务将类别标签或实例 ID 分配给每个像素...转载 2019-10-23 10:13:05 · 678 阅读 · 1 评论 -
论文:图像分割的U-Net系列方法
膜拜大佬  在图像分割任务特别是医学图像分割中,U-Net[1]无疑是最成功的方法之一,该方法在2015年MICCAI会议上提出,目前已达到四千多次引用。其采用的编码器(下采样)-解码器(上采样)结构和跳跃连接是一种非常经典的设计方法。目前已有许多新的卷积神经网络设计方式,但很多仍延续了U-Net...转载 2019-10-23 09:58:34 · 4701 阅读 · 2 评论 -
论文:FCOS: Fully Convolutional One-Stage Object Detection
转载自大佬文章,有一点没看懂,还需要慢慢消化!论文地址 | https://arxiv.org/pdf/1904.01355.pdf1 .网络整体介绍  本文提出了一种全卷积one-stage目标检测算法(FCOS),以逐像素预测的方式解决目标检测问题,类似于语义分割。目前最流行的不论是one...转载 2019-10-22 17:34:20 · 252 阅读 · 0 评论 -
论文:deep metric learning using triplet network triplet network(Triplet Network)
先放着,明天再写!论文原址:https://arxiv.org/pdf/1412.6622.pdf原创 2019-10-20 22:17:41 · 3183 阅读 · 0 评论 -
论文:Fully-Convolutional Siamese Networks for Object Tracking(SiamFC)
过两天再写1、项目原址:http://www.robots.ox.ac.uk/~luca/siamese-fc.html2、代码:https://github.com/bertinetto/siamese-fc3、https://blog.csdn.net/autocyz/article/details/53216786原创 2019-10-20 22:13:46 · 440 阅读 · 0 评论 -
论文:Learning a Similarity Metric Discriminatively, with Application to Face Verification(孪生网络Siamese)
过两天再写1、https://blog.csdn.net/sxf1061926959/article/details/54836696/2、https://blog.csdn.net/ybdesire/article/details/84072339转载 2019-10-20 22:11:11 · 365 阅读 · 0 评论 -
论文:(FPN特征金字塔)Feature Pyramid Networks for Object Detection
论文链接:https://arxiv.org/pdf/1612.03144.pdf代码:https://www.jianshu.com/p/324af87a11a6论文概述:  作者提出的多尺度的object detection算法:FPN(feature pyramid netwo...翻译 2019-10-20 19:19:14 · 941 阅读 · 0 评论 -
论文:MASK-RCNN
https://blog.csdn.net/heavenpeien/article/details/80534963原创 2019-10-17 15:46:20 · 113 阅读 · 0 评论 -
Fully Convolutional Networks
没啥图片,将就着看吧转载 2019-10-17 09:03:44 · 151 阅读 · 0 评论 -
论文:Fast Online Object Tracking and Segmentation :A Unifying Approach(SiamMask)
Fast Online Object Tracking and Segmentation :A Unifying Approach快速在线目标跟踪和分割:一种统一的方法论文地址:论文地址源码:源码GitHub大佬知乎:我对Siamese网络的一点思考(SiamMask)参考博客:SiamMask:视频跟踪最高精度 (中科院王强大神作品)参考博客:【阅读笔记】SiamMask: Fast...原创 2019-10-14 21:13:08 · 347 阅读 · 0 评论 -
Object Tracking算法综述(持续更新中)
最近我需要学习目标跟踪算法,所以找近几年tracking论文,看到多少写多少,持续更新学习!参考博客1:https://blog.csdn.net/zhu_hongji/article/details/80515031 (目标跟踪算法研究综述)参考博客2:https://www.zhihu.com/question/26493945 (计算机视觉中,目前有哪些经典的目标跟踪算法?)参考博客...翻译 2019-08-14 20:27:25 · 808 阅读 · 0 评论 -
论文:Temporal Segment Networks: Towards Good Practices for Deep Action Recognition(TSN)
2016 ECCV Temporal Segment Networks Towards Good Practices for Deep Action Recognition摘要:深度卷积网络在静止图像的视觉识别方面取得了巨大的成功。然而,对于视频中的动作识别,相对于传统方法的优势并不明显。本文旨在探索视频动作识别中有效的ConvNet架构设计原则,并在有限的训练样本下学习这些模型。我们的第一个贡...原创 2019-08-09 22:01:52 · 700 阅读 · 0 评论 -
论文:YOLOv1-v2-v3
从YOLOv1到YOLOv3,目标检测的进化之路https://blog.csdn.net/guleileo/article/details/80581858翻译 2019-08-08 22:17:56 · 673 阅读 · 0 评论 -
将jpg等格式的图片转化为YUV序列(OpenCV、FFmpeg、MATLAB)
将jpg等格式的图片转化为YUV序列有多种,简单介绍其中三种(网上也有很多资料)原创 2019-05-27 22:05:09 · 6393 阅读 · 0 评论 -
LibSVM的介绍与实例
http://blog.sina.com.cn/s/blog_5dd2e9270100wrfa.htmlhttps://www.cnblogs.com/lvchaoshun/p/5906890.html转载 2019-05-27 21:38:32 · 7597 阅读 · 1 评论 -
论文:Histograms of Oriented Gradients for Human Detection(HOG)
方向梯度直方图(Histogram of Oriented Gradient, HOG)特征来源于论文《HistogramsofOrientedGradientsforHumanDetection_cvpr2005》,网上可以下载到该论文,也有这篇论文的中文翻译:用于人体检测的方向梯度直方图因为HOG不是一个新鲜概念,所以网上有很多资料讲述,OpenCV甚至直接写好了封装函数,不过这也说明HOG...翻译 2019-05-26 20:17:58 · 1413 阅读 · 0 评论 -
动态聚类算法之ISODATA算法
参考书目:《模式识别(张学工第二版)》ISODATA聚类算法是k-means算法的改进。与k-means均值算法有两点不同:第一,它不是每调整一个样本的类别就重新计算一次各类样本的均值。而是在每次把全部样本都调整完毕之后才重新计算一次样本的均值,前者一般称为逐个样本修正法,后者称为成批样本修正法。第二,ISODATA算法不仅能通过调整样本所属类别完成聚类分析,而且还能自动地进行类的“合并”和“分...原创 2019-05-07 19:28:44 · 13712 阅读 · 0 评论