图像处理杂烩
图像处理基本原理与算法技术
Zhang_P_Y
关注机器学习、计算机视觉、嵌入式(MCU、DSP、ARM)和桌面开发等领域
展开
-
【计算机视觉】如何用传统方法在实现目标检测?
【计算机视觉】如何用传统方法在实现目标检测?问题描述深度学习虽然很火热,但是数据量不大的时候,深度学习的性能还是比较差的,最主要的是模型能力太强,学出来之后不能泛化,因此一种可选的方法就是 不要处处都是深度模型,试试返璞归真的传统方法。传统方法基本上传统机器方法最直观的就是分类、回归,而对于计算机视觉中级任务:目标检测 该如何下手呢?一种最直观的想法就是用滑动窗口 sliding wind...原创 2020-04-15 17:26:08 · 1200 阅读 · 0 评论 -
【计算机视觉】如何用传统方法在小样本数据集上实现语义分割模型?
【计算机视觉】如何用传统方法在小样本数据集上实现语义分割模型?问题描述深度学习虽然很火热,但是数据量不大的时候,深度学习的性能还是比较差的,最主要的是模型能力太强,学出来之后不能泛化,因此一种可选的方法就是 不要处处都是深度模型,试试返璞归真的传统方法。传统方法基本上传统机器方法最直观的就是分类、回归,而对于计算机视觉中级任务:语义分割 该如何下手呢?一种最直观的想法就是对像素逐个进行分类...原创 2020-04-14 20:29:51 · 1559 阅读 · 0 评论 -
【计算机视觉】关于`partial cross entropy loss`用于弱监督语义分割中的说明
【计算机视觉】关于partial cross entropy loss用于弱监督语义分割中的说明弱监督标签以两类别语义分割为例,背景和前景,给定的弱监督标签是只对前景个一小部分进行了标注。这个只是直接拿这个弱监督标签进行训练,会有一定的问题,因为大部分的前景标签都没有标注出来,所以前景类别会受到较大的抑制。GT标签:Weak标签:采用 partial cross entropy loss...原创 2020-04-12 13:42:53 · 1004 阅读 · 0 评论 -
【计算机视觉】使用 Permutohedral Lattice 进行快速高维度滤波
【计算机视觉】使用 Permutohedral Lattice 进行快速高维度滤波大一统的高维高斯滤波表达式对任意的位置 pi 处的值 vi 进行滤波,与具有临近位置的其它值进行混合。通常这些值 vi 是均匀的像素颜色。如果位置 pi 是两维的像素位置,那么该公式表达的是高斯模糊 Gaussian blur。如果位置 pi 是像素位置与颜色的联合,比如x,y,r,g,b共五维,那么该公...原创 2020-04-12 08:44:26 · 1215 阅读 · 0 评论 -
【计算机视觉】no-local means方法
【计算机视觉】no-local means方法大一统的高维高斯滤波表达式对任意的位置 pi 处的值 vi 进行滤波,与具有临近位置的其它值进行混合。通常这些值 vi 是均匀的像素颜色。如果位置 pi 是两维的像素位置,那么该公式表达的是高斯模糊 Gaussian blur。如果位置 pi 是像素位置与颜色的联合,比如x,y,r,g,b共五维,那么该公式表达的是颜色双边滤波 color ...原创 2020-04-11 15:41:30 · 658 阅读 · 0 评论 -
【计算机视觉】双边滤波 `bilateral filter` 方法
【计算机视觉】双边滤波 bilateral filter 方法大一统的高维高斯滤波表达式对任意的位置 pi 处的值 vi 进行滤波,与具有临近位置的其它值进行混合。通常这些值 vi 是均匀的像素颜色。如果位置 pi 是两维的像素位置,那么该公式表达的是高斯模糊 Gaussian blur。如果位置 pi 是像素位置与颜色的联合,比如x,y,r,g,b共五维,那么该公式表达的是颜色双边滤...原创 2020-04-11 15:39:28 · 785 阅读 · 0 评论 -
【计算机视觉】pydensecrf在灰度图上的使用
【计算机视觉】pydensecrf在灰度图上的使用pydensecrf 安装直接 pip install git+https://github.com/lucasb-eyer/pydensecrf.git 即可安装对于灰度图的使用 addPairwiseBilateral 不 work典型的RGB图像设置二元势函数的方式 d.addPairwiseGaussian(sxy=20, ...原创 2020-04-10 19:19:31 · 794 阅读 · 0 评论 -
YUV格式全解
YUV是指亮度参量和色度参量分开表示的像素格式,而这样分开的好处就是不但可以避免相互干扰,还可以降低色度的采样率而不会对图像质量影响太大。YUV是一个比较笼统地说法,针对它的具体排列方式,可以分为很多种具体的格式。转载一篇对yuv格式解释的比较清楚地文章,也可以直接参考微软的那篇文章。对于YUV格式,比较原始的讲解是MPEG-2 VIDEO部分的解释,当然后来微软有一个比较经典的解释,中文转载 2016-02-27 14:05:30 · 1535 阅读 · 1 评论 -
JPG文件结构分析
【转自网络 作者:一 江秋水】一、简述JPEG是一个压缩标准,又可分为标准 JPEG、渐进式JPEG及JPEG2000三种:①标准JPEG:以24位颜色存储单个光栅图像,是与平台无关的格式,支持最高级 别的压缩,不过,这种压缩是有损耗的。此类型图片在网页下载时只能由上而下依序显示图片,直到图片资料全部下载完毕,才能看到全貌。②渐进式 JPEG:渐进式JPG为标准JPG转载 2016-02-23 20:01:50 · 4371 阅读 · 1 评论 -
Jpeglib读取jpg文件
整理自:http://hi.baidu.com/lewutian/item/e8eed42664ee61122a0f1c89http://blog.csdn.net/mcgrady_tracy/article/details/74390661.下载编译库下载库:http://www.ijg.org/ 网址下面的windows版本的。本文下载的是jpe转载 2016-02-19 22:13:39 · 4330 阅读 · 0 评论 -
IJG JPEG使用说明
IJG JPEG库使用说明 版权所有:1994-1998,Thomas G. Lane本文档是IJG软件的一部分。分发和使用的条件请参看README文档。 本文档讲述如何在应用程序中使用IJG(IndependentJPEG Group) JPEG库。如果你想写一个使用本库的程序,请你读本文档。文件example.c为调用JPEG库转载 2016-02-19 22:16:40 · 3863 阅读 · 0 评论 -
【计算机视觉】形态学滤波
【计算机视觉】形态学滤波标签(空格分隔): 【图像处理】 【信号处理】版权声明:本文为博主原创文章,转载请注明出处http://blog.csdn.net/lg1259156776/。说明:本文主要想弄清楚形态学滤波在图象处理和信号处理中的应用,图像处理中非常直观的通过腐蚀膨胀获得开闭运算的效果,而在数据实时滤波中,形态学滤波也是可以使用的。形态学滤波基本知识 原理:在特殊领域运算形式——结构元原创 2015-11-28 16:30:59 · 18830 阅读 · 4 评论 -
【计算机视觉】特征脸EigenFace与PCA
【计算机视觉】特征脸EigenFace与PCA标签(空格分隔): 【图像处理】 版权声明:本文为博主原创文章,转载请注明出处http://blog.csdn.net/lg1259156776/。说明:本文主要想弄清楚将人脸识别推向真正可用的第一种方法:特征脸方法。【这里采用的是1维的PCA方法,将图像转变为行向量或者列向量,虽然破坏了几何结构,但是处理比较直观方便】第一步是构建样本集合获取包含原创 2015-11-27 16:56:30 · 5031 阅读 · 0 评论 -
【计算机视觉】反向投影直方图检测特定的图像内容
【计算机视觉】反向投影直方图检测特定的图像内容标签(空格分隔): 【图像处理】原理:获取特定的图像内容直方图,并进行归一化,然后将输入图像的某一位置上像素值(多维或灰度)对应在直方图的一个bin上的值来代替该像素值,所以得到的反向投影图是单通的。举个小例例如灰度图像如下Image=0 1 2 3 4 5 6 7 8 9 10 11原创 2015-11-14 19:38:39 · 1990 阅读 · 0 评论 -
【计算机视觉】opencv读取多个摄像头
【计算机视觉】opencv读取多个摄像头标签(空格分隔): 【图像处理】说明:今天蹭了机器视觉课程,讲到了stereopsis,立体视觉,讲到了关于通过多个摄像头获取object的depth信息的事情,因为想到从来没有试过打开多个摄像头进行过处理,这次进行了测试,这里小小记录一下。opencv提供的VideoCapture可以很方便的打开视频、摄像头设备,而且直接输入对应的摄像头标号即可,或者视频的原创 2015-11-12 20:45:24 · 8869 阅读 · 2 评论 -
【计算机视觉】Opencv中的Face Detection using Haar Cascades
【计算机视觉】Opencv中的Face Detection using Haar Cascades标签(空格分隔): 【图像处理】声明:引用请注明出处http://blog.csdn.net/lg1259156776/五种典型的haar-like特征,为何能用来检测人脸,人眼呢? 它给出的一个经验之谈是 1. the region of the eyes is often darker than原创 2015-11-06 09:25:17 · 4044 阅读 · 0 评论 -
【DSP开发】利用CCS5.4开发基于DSP6455的JPEG2000图像解压缩过程
【DSP开发】利用CCS5.4开发基于DSP6455的JPEG2000图像解压缩过程声明:引用请注明出处http://blog.csdn.net/lg1259156776/说明:前端是时间基于VS2010工程,在windows上实现了对openjpeg2000的改写,实现了从内存中读取数据进行解压缩的工作。由于某些技术储备需要,将其移植到DSP6455中进行解压缩。本文记录的就是整个移植过程。原创 2015-10-23 12:41:19 · 3003 阅读 · 1 评论 -
PPM / PGM / PBM 图像文件格式
PPM / PGM / PBM 图像文件格式说明:在进行图像压缩后传输,然后解压缩显示的过程中,通常会用到PPM / PGM / PBM 图像文件格式来对解压后的图像像素值进行存储,因为没有进行压缩,所以不丢失信息,但同时也文件比较大。本文就是对这种图像文件格式进行介绍。原创 2015-10-15 17:11:47 · 5352 阅读 · 0 评论 -
JPEG2000开发SDK及其特点
JPEG2000开发SDK及其特点说明:JPEG2000被开发来取代JPEG,但因为大量核心算法被专利注册,结果并没有这样发展。但是从性能上讲JPEG2000更好,而开发起来常常需要一些SDK,商用的或者是开源的支持。本文就总结一些DSK及其特点,以帮助初入者快速进入开发阶段。原创 2015-10-14 09:05:17 · 2238 阅读 · 0 评论 -
关于opencv的几个小总结
关于opencv的几个小总结说明:opencv是一个非常好用的开源图像处理与计算机视觉支持库,但是在实际使用中经常会遇到各种费解的问题,这里将遇到的一些问题进行汇总,以便参考。原创 2015-10-13 21:01:41 · 2591 阅读 · 0 评论 -
五种常用的图片格式及其是否有数据压缩的总结
本文主要介绍五种最常见和最常用的图像格式:BMP,PNG,JPEG,JPEG200,以及GIF。在进行图像处理相关应用之前第一步首先是能够读取这些图像文件,虽然很多开发工具支持库比如OpenCV等已经帮助节省了这些工作的麻烦,便利的同时也使得开发人员不再熟悉这些基本的图像格式。本文的作用就在于将这五种常用的图像格式进行分条叙述,方便查阅。原创 2015-10-12 22:44:00 · 22009 阅读 · 6 评论 -
JPEG与JPEG2000
JPEG与JPEG2000声明:引用请注明出处http://blog.csdn.net/lg1259156776/背景介绍 JPEG 全名为 Joint Photographic Experts Group,它是一个在国际标准组织(ISO)下从事静态图像压缩标准制定的委员会。它制定出了第一套国标静态图像压缩标准:ISO 10918-1 就是我们俗称的 JPEG 了。由于JPEG优良的品质,使得它原创 2015-10-09 23:36:24 · 5527 阅读 · 0 评论 -
医学成像原理与图像处理一:概论
医学成像原理与图像处理一:概论引言:本系列博客为医学成像原理与图像处理重要笔记,由于是手写,在此通过扫描录入以图片的形式和电子版增补内容将其进行组织和共享。前半部分内容为图像处理基础内容,包括图像的灰度级处理、空间域滤波、频率域滤波、图像增强和分割等;后半部分内容为医学影象技术,包括常规胶片X光机、CR、DR、CT、DSA等X射线摄影技术、超声成像技术、磁共振成像(MRI)技术等。本篇主要内容是概论。原创 2015-09-29 21:07:38 · 6479 阅读 · 3 评论 -
视频数据流
视频数据流声明:引用请注明出处http://blog.csdn.net/lg1259156776/什么是视频数据流(video streaming) 指的是将压缩(通常)的视频经过私有或者公用的网络(可以是因特网,局域网,卫星或者有线电视等)传输,之后进行解压缩并在设备上进行播放的行为。为何对视频进行压缩?主要是为了节省传输带宽和存储空间。 从表格中可以看出压缩和不压缩的区别,压缩的好处原创 2015-09-29 17:27:54 · 4671 阅读 · 1 评论 -
图像压缩算法
图像压缩算法声明:引用请注明出处http://blog.csdn.net/lg1259156776/理论基础香农的信息论,在不产生任何失真的前提下,通过合理的编码,对于每个信源符号分配不等长的码字,平均码长可以任意接近于信源的熵。在这个理论框架下产生了几种不同的无失真的信源编码方法:哈夫曼编码,算术编码、字典编码等。后来出现了更多的编码方式:如KLT编码、分形编码、模型编码、子带编码和基于小波的编码原创 2015-09-23 16:20:26 · 12778 阅读 · 0 评论 -
Haar-like特征来龙去脉
Haar-like特征来龙去脉声明:引用请注明出处http://blog.csdn.net/lg1259156776/ haar-like特征概念haar-like特征是是计算机视觉领域一种常用的特征描述算子。它最早是由Papageorigiou等人用于人脸描述。目前常用的Haar-like特征可以分为三类:线性特征、边缘特征、点特征(中心特征)、对角线特征。如下图所示 Haar特征(Haar-原创 2015-09-23 11:20:55 · 13583 阅读 · 0 评论 -
DSP VLIB实验
声明:引用请注明出处http://blog.csdn.net/lg1259156776/ 引言 在dsp开发中,为了节省开发时间和难度,TI将一些成熟的算法封装为模块,供开发者使用。如果能充分利用这些算法支持库,对于加快dsp开发进程与提高代码质量、稳定性有非常大的帮助。VLIB是一个经过深入优化的计算机视觉算法库,支持C64x和C64x+处理器内核,提供了如下图所示的功能函数接口。原创 2015-09-23 08:39:20 · 4452 阅读 · 0 评论 -
经典PID控制及应用体会总结
经典PID控制及应用体会总结PID控制原理PID是一种线性控制器,它根据给定值rin(t)r_{in}(t)与实际输出值yout(t)y_{out}(t)构成控制方案: 重点关注相关算法是如何对偏差进行处理的: PID控制器各校正环节的作用如下: 比例环节: 成比例地反映控制系统的偏差信号e(t),偏差一旦产生,控制器立即产生控制作用,以减小偏差。积分环节:主要用于消除静差,提高系统的无原创 2015-09-20 23:15:10 · 31497 阅读 · 0 评论 -
经典滤波器设计
经典滤波器设计摘要经典滤波器的滤波思路是从频率域上将噪声滤掉,关键是设计相应的滤波器传递函数H(s)、H(z),分别对应着模拟滤波器和数字滤波器的实现。模拟滤波器主要是通过电感(L)、电容(C)、电阻(R)和运放(OPA)等元器件搭建传递函数为H(s)或者近似为H(s)的硬件电路来实现,比如RC滤波电路和有源滤波器等。数字滤波器(DF)从实现的结构上或者是单位脉冲响h(n)上可以分为无限长脉冲响应(原创 2015-09-20 21:50:47 · 21997 阅读 · 0 评论 -
颜色空间总结
颜色空间总结RGB、HSV、YUV什么是颜色Wiki是这样说的:颜色或色彩是通过眼、脑和我们的生活经验所产生的一种对光的视觉效应。嗯,简单点说,颜色就是人对光的一种感觉,由大脑产生的一种感觉。感觉是一个很主观的东西,你怎么确定你看到的红色和我看到的是一样的呢?这个视频解释的很不错。我们需要先假设正常人对于同一种光产生的感觉基本是一致的,讨论才能继续下去。人的视网膜上布满了感光细胞,当有光线传入人眼时原创 2015-09-09 16:05:02 · 26468 阅读 · 1 评论 -
图像相似度测量与模板匹配总结
摘要本文主要总结了进行目标跟踪、检测中经常使用到的图像相似度测量和模板匹配方法,并给出了具体的基于OpenCV的代码实现。引言模板匹配是一种在源图像中寻找与图像patch最相似的技术,常常用来进行目标的识别、跟踪与检测。其中最相似肯定是基于某种相似度准则来讲的,也就是需要进行相似度的测量。另外,寻找就需要在图像上进行逐行、逐列的patch窗口扫描,当然也不一定需要逐行逐列的扫描,当几个原创 2015-07-24 12:21:16 · 42225 阅读 · 3 评论