图像相关基础知识
文章平均质量分 90
NCU_wander
这个作者很懒,什么都没留下…
展开
-
手机镜头,噪声建模,ISP,ISO与analog gain
最近在做夜景去噪声的low level工作,相关工作可以说是非常的难以及boring。因为这种low level你必须往上层,往底层走,甚至说需要了解ISP相关的知识;因此这段时间对于相关知识进行了大量的学习与了解。......原创 2022-08-25 12:16:45 · 3225 阅读 · 1 评论 -
BM3D、域变换与Non-Local
近期在了解Non-local相关知识,之前对Non-local学习的不够深入,这一次算是了解的更为全面一些,在此予以总结和记录。BM3D作为一款非常经典的图像去噪算法,可以从其中学习到非常多的可以应用在深度学习领域的idea。借助于文章传统图像降噪算法之BM3D原理详解 我们一起学习一下BM3D算法的内核与精神。BM3D 主要用于去除图像中的加性高斯白噪声(Additive White Gaussian Noise, AWGN)。这里主要涉及三个概念:加性:即噪声其对原始信号的影响可表示为线性叠加。对于原创 2022-07-08 14:14:24 · 1087 阅读 · 0 评论 -
基于区域和基于边缘的图像分割
1、图像分割的概念图像分割是将图像分割成不同的区域或类别,并使这些区域或类别对应于不同的目标或者局部目标。每个区域包含具有相似属性的像素,并且图像中的每个像素都分配给这些类别之一。一个好的图像分割通常指同一类别的像素具有相似的强度值并形成一个连通区域,而相邻的不同类别的像素具有不同的值。分割技术可以是非上下文的(不考虑图像中特征和组像素之间的空间关系,只考虑一些全局属性,例如颜色或灰度值),也可以是上下文的(另外利用空间关系,例如对具有相似灰度的空间封闭像素分组)。从分割的技术来说,图像分割方法主要分为原创 2022-03-23 18:49:55 · 11401 阅读 · 0 评论 -
sobel算子 拉普拉斯算子以及散度与梯度的概念
在ECBSR论文的代码研究中,我发现关于ECBSR提出的多分支重参数化模型中,代码用到了sobel算子与laplace算子,很难判断这两个算子是为了论文的创新点还是真的有用,这块只能等待后续的对比实验。1、拉普拉斯算子首先是散度与梯度的概念:散度和旋度的物理意义是什么?贴一下原文回答作者的总结:通过物理来理解这四个概念还是比较容易的。通量是单位时间内通过的某个曲面的量;散度是通量强度(求解任一点的散度);环流量是单位时间内环绕的某个曲线的量;旋度是环流量强度(求解任一点的旋度)在此基础上原创 2021-10-25 20:25:41 · 4901 阅读 · 0 评论 -
H264编码和M-JPEG、HEVC
1、H264H264 是 MPEG-4 标准所定义的最新编码格式,同时也是技术含量最高、代表最新技术水平的视频编码格式之一,标准写法应该是H.264H264 视频格式是经过有损压缩的,但在技术上尽可能做的降低存储体积下获得较好图像质量和低带宽图像快速传输。H264压缩技术主要采用了以下几种方法对视频数据进行压缩。包括:帧内预测压缩,解决的是空域数据冗余问题。帧间预测压缩(运动估计与补偿),解决的是时域数据冗余问题。整数离散余弦变换(DCT),将空间上的相关性变为频域上无关的数据然后进行量化。原创 2021-10-21 17:57:24 · 5168 阅读 · 0 评论 -
Optical-flow和grid-sample和可变形卷积
1.摘要随着计算机视觉学界从图像理解转向视频理解,互联网用户从发布图片朋友圈转向发布短视频,人们对视频的研究和应用的关注不断增强。光流估计作为视频理解的隐形战士,等着我们去寻找其踪迹。 本文首先介绍了什么是视频光流估计;再介绍光流估计的算法原理,包括最为经典的Lucas-Kanade算法和深度学习时代光流估计算法代表FlowNet/FlowNet2;最后,介绍了视频光流估计的若干应用。希望对光流估计的算法和应用有个较为全面的介绍。2.介绍光流,顾名思义,光的流动。比如人眼感受到的夜空中划过的流星。在计原创 2021-10-13 18:23:47 · 1722 阅读 · 0 评论 -
图像视频降噪的现在与未来
全文核心部分内容来自于 https://zhuanlan.zhihu.com/p/106191981,即为腾讯研究院针对降噪的讲解PPT。在此之前首先讲述一下多帧降噪的相关原理,一、噪点产生的原因为什么手机在夜间拍摄会出现噪点呢?其实噪点的生成跟CMOS有很大关系。数码相机包括手机将光线和物体的信息通过镜头传输至CMOS过程中会产生热量,快门时间越长,CMOS所接收的光线照射时间越多,CMOS的工作时间也就越长。CMOS在长时间工作的时候,会产生热量,而这些热量会均匀得分布与CMOS每一个晶体单元原创 2021-09-26 15:19:34 · 2002 阅读 · 0 评论 -
RGB、YUV420、NV21、I420编码; raw转nv21转RGB代码
一、RGB与YUV首先了解视频编码为什么使用YUV420而不是rgb。那么需要了解两者的原理,看图说话。所以从内存的角度来说,yuv单位像素使用的内存更低,但是两者表示的效果是一致的,也可以认为rgb过度绘制了,把人眼无法分辨的区域也进行了绘制。下面看一下两者之间内存暂用对比,这里采用·rgb24对比RGB24使用24位来表示一个像素,RGB分量都用8位表示,取值范围为0-255。在一个22的像素区域,RRG暂用的字节数为22*3=12字节。那么用yuv表示,占用的字节数为4(Y)+1(u)+1(原创 2021-08-21 15:34:01 · 1620 阅读 · 0 评论 -
视频镜头转换检测与图片模糊检测
最近在看有关于视频镜头转换检测的相关内容,突然感觉和研究生期间做的路沿检测内容非常相似,也就是当年由陈东大佬命名的滑动窗格法。重看镜头转换检测内容,觉得十分亲切。1、镜头转换检测2、图像清晰度检测3、较暗图片分拣理解一下图像的灰度平均值与灰度平均方差,灰度平均值主要反映的是图像的基础亮度,而灰度平均方差可以反应图像高频部分的大小。如果一副图片灰度平均值过高或者过低,那么对应的图片可能处于过曝或者曝光不足的状态;如果一幅图看起来很均一,则这张图的灰度平均方差值较小;反之若一张图片看起来非常的鲜艳,则灰原创 2020-07-15 15:53:37 · 1235 阅读 · 0 评论