![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
图像处理
文章平均质量分 74
studyeboy
这个作者很懒,什么都没留下…
展开
-
人脸检测——Faceboxes
我的系统中使用的Python3.8,直接。使用的是python3.6,所以修改。需要用到的文件,nms中的编译文件为。原创 2023-03-23 16:35:12 · 117 阅读 · 0 评论 -
图像亮度调整
基于RGB空间亮度调整算法:主要是对RGB空间进行亮度调整。计算出调整系数后,调整手段主要有两种:1) 基于当前RGB值大小进行调整,即R、G、B值越大,调整的越大,例如:当前像素点为(100,200,50),调整系数1.1,则调整后为(110,220,55);2) 不考虑RGB值大小的影响,即始终对各个点R、G、B值进行相同的调整,例如:当前像素点为(100,200,50),调整系数10/255,则调整后为(110,210,60)。原创 2023-02-23 16:12:25 · 2100 阅读 · 0 评论 -
智能设计-阿里巴巴Banner设计
阿里巴巴Banner设计的核心在于优化会场页面拓展及Banner尺寸拓展两部分低水平重复建设工作,提升设计效率,压缩设计周期,为设计师保留充裕的创意时间。原创 2022-11-03 15:46:23 · 698 阅读 · 0 评论 -
sketch-矢量绘图应用软件
Sketch是一款适用于所有设计师的矢量绘图应用软件,专为图标设计和界面设计而生,是目前进行网页、图标以及界面设计的必不可少的软件之一。Sketch有出色的UI使用体验,比如Sketch中的画布是无限大小的,每个图层都支持多种填充模式,还有实用的文字渲染和文本式样,以及文件导出工具。例如播放条图层既有文字又有形状,无论怎么拉伸,使用Sketch的resizing功能,内容都会根据宽度来进行适配。原创 2022-11-03 13:23:11 · 302 阅读 · 0 评论 -
Towards End-to-End Unified Scene Text Detection and Layout Analysis(2022)
场景文本检测和文档布局分析长期以来一直被视为不同图像域中的两个独立任务。在本文中,我们将它们结合在一起,介绍了统一场景文本检测和布局分析的任务。引入了第一个分层场景文本数据集以实现这一新颖的研究任务。我们还提出了一种新颖的方法,能够同时检测场景文本并以统一的方式形成文本集群。综合实验表明,我们的统一模型比多种设计良好的基线方法具有更好的性能。此外,该模型在多个场景文本检测数据集上实现了最先进的结果,而无需复杂的后处理。原创 2022-11-03 10:10:36 · 624 阅读 · 0 评论 -
自动排版布局-Layout GAN
布局对图像设计和场景生成非常重要。我们提出了一种新的生成对抗网络,称为Layout GAN,它通过建模不同类型的2D元素的几何关系来综合布局。Layout GAN的生成器将一组随机放置的2D图形元素作为输入,并使用自我注意力模块来细化它们的标签和几何参数,生成逼真的布局。精确布局对于良好布局至关重要。因此我们提出了一种新的可微线框渲染层,该层将生成的布局映射到线框图像,在此基础上,使用基于CNN的鉴别器来优化图像空间的布局。原创 2022-11-02 14:52:51 · 1476 阅读 · 0 评论 -
JoJoGAN: One Shot Face Stylization(2021)
[Paper]JoJoGAN:One Shot Face Stylization[Code]mchong6/JoJoGAN摘要虽然最近在少镜头图像风格化方面取得了进展,但这些方法未能捕捉到人类显而易见的风格细节。眼睛的形状、线条的粗细等细节对于模型来说尤其难以学习,尤其是在有限的数据设置下。在这项工作中,我们的目标是执行使细节正确的 oneshot 图像风格化。给定参考样式图像,我们使用 GAN 反演近似配对真实数据,并使用该近似配对数据对预训练的 StyleGAN 进行微调。然后我们鼓励 Styl原创 2022-05-25 11:40:44 · 1042 阅读 · 1 评论 -
图像旋转坐标计算
图像坐标系和笛卡尔坐标系转换图像旋转参考资料图像旋转算法原理-- 旋转矩阵图像旋转原理python实现原创 2022-05-17 09:21:44 · 1490 阅读 · 0 评论 -
千图成像原理
千图成像就是用很多张图片拼接成一张完整的图片,需要一张背景图像和一个图像库。根据背景图的结构用图像库中的图像进行拼接,最终形成新的拼接图像。原理将背景图像切割为若干小块,切割的越细生成的图像的效果越好,或者直接使用背景图像中的每个像素点;然后用图像库中与之最相近的图像拼接完成。颜色相近灰度图像直接计算所有像素灰度值的平均值,取最接近N张图后供后期再次筛选。彩色图像分别计算R/G/B的平均值,对于一张图像得到的是一个类似于[20, 30, 40]的数组,然后计算欧式距离,取最接近n张图像供后期原创 2022-05-10 13:12:51 · 629 阅读 · 0 评论 -
16进制颜色值转RGB颜色值
常规项目:# 16进制颜色格式颜色转换为RGB格式def hex_to_rgb(hex): r = int(hex[1:3],16) g = int(hex[3:5],16) b = int(hex[5:7], 16) return r,g,bdef add_bg_color(image, rgb): bg_img = np.zeros((image.shape[0], image.shape[1], 3), np.uint8) bg_img[:, :,原创 2022-04-18 14:53:13 · 4940 阅读 · 0 评论 -
windows下批量重命名图像名称bat脚本
@echo set a=0setlocal EnableDelayedExpansionfor %%n in (*.jpg, *.png, *.jpeg) do ( set ext=%%~xn ren "%%n" "2022-0215_!a!!ext!" set /A a+=1)原创 2022-02-15 08:59:51 · 1242 阅读 · 0 评论 -
base64和图像之间的转换
Base64是网络上最常见的用于传输8bit字节码的编码方式之一,Base64就是一种基于64个可打印字符(包括a-z、A-Z、0-9、/、+)来表示二进制数据的方法。Base64编码是从二进制到字符的过程,可以用于在HTTP环境下传递较长的标识信息。按照RFC0的定义,Base64 被定义为:Base64内容传送编码被设计用来把任意序列的8位字节描述为一种不易被人直接识别的形式。Base64要求把每三个8bit的字节转换为四个6bit的字节(38=46=24),然后把6bit再添加两位高位0,组成四个原创 2021-11-26 16:47:00 · 1020 阅读 · 0 评论 -
EdgeFlow:Achieving Practical Interactive Segmentation with Edge-Guided Flow(2021)
[Paper] EdgeFlow:Achieving Practical Interactive Segmentation with Edge-Guided Flow(2021)[Code]PaddlePaddle/PaddleSegEdgeFlow: Achieving Practical Interactive Segmentation with Edge-Guided FlowEdgeFlow:使用 Edge-Guided Flow 实现实用的交互式分割高质量的训练数据在图像分割任务中起着关键原创 2021-11-19 16:50:26 · 10478 阅读 · 0 评论 -
png格式图像转成jpg图像时出现异常颜色值
问题描述png图像有的可能包含透明通道,包含透明通道的png格式图像转换成jpg格式图像时,会出现异常的颜色值。非通过直接修改扩展名的方法,读取后又保存的。直接通过修改扩展名的方法读取保存后没有异常,但是本质没改变。对应图像属性解决方法img_path = '/special_data'out_path = '/special_data_jpg'for img_name in os.listdir(img_path): img = Image.open(os.path.join原创 2021-11-09 17:22:54 · 3881 阅读 · 0 评论 -
图像CMYK模式转RGB模式
问题描述图像jpeg格式转jpg格式时,出现色差。有色差的jpeg图像与其它jpeg图像的差别:问题原因图像是CMYK模式,一般的将CMYK直接转换成RGB模式会产生色差。该代码实现读取保存后,图像没有色差是因为图像读取保存后,虽然后缀名改变了,但是图像的模式本质还是CMYK模式,没有进行CMYK到RGB格式的转换。 img = Image.open('/test/2021-10-28_3150.jpeg') print(img.mode, type(img)) img.save('/原创 2021-11-09 16:58:07 · 5441 阅读 · 0 评论 -
numpy.minimum()和cv2.bitwise_and()
numpy.minimum(x1, x2)对应数据类型为numpy.ndarray。numpy.minimum(x1, x2, /, out=None, *, where=True, casting='same_kind', order='K', dtype=None, subok=True[, signature, extobj]) = <ufunc 'minimum'>cv2.bitwise_and(src1, src2)对应数据类型为array。参考资料python nump原创 2021-11-08 16:41:32 · 425 阅读 · 0 评论 -
图像位深转换:64位->32位
问题描述在深度学习的图像处理中遇到如下问题:TypeError: can't convert np.ndarray of type numpy.uint16. The only supported types are: float64, float32, float16, complex64, complex128, int64, int32, int16, int8, uint8, and bool.问题原因问题出现,是因为 改变了图像的读取参数。之前输入的图像是通过cv2.imread(i原创 2021-11-08 16:32:41 · 2191 阅读 · 1 评论 -
引导图像滤波(Guided Image Filtering)
[Paper] Guided Image Filtering(2013)引导图像滤波摘要——在本文中,我们提出了一种新的显式图像滤波器,称为引导滤波器。从局部线性模型导出,引导滤波器通过考虑引导图像的内容来计算过滤输出,引导图像可以是输入图像本身或另一个不同的图像。引导过滤器也是一个比平滑更通用的概念:它可以将引导图像的结构传输到过滤输出,从而实现新的过滤应用,例如去雾和引导羽化。此外,无论内核大小和强度范围如何,引导滤波器自然具有快速且非近似的线性时间算法。目前,它是最快的边缘保留滤波器之一。实验表明原创 2021-11-05 13:58:50 · 9637 阅读 · 2 评论 -
SKNet(2019)
在神经科学界,视皮层神经元的感受野大小受到刺激的调节,即对不同刺激,感受野的大小应该不同。目前很多卷积神经网络的相关工作都只是通过改进网络的空间结构来优化模型,如Inception模型通过引入不同大小的卷积核来获得不同感受野上的信息。但在构建传统CNN时一般在同一层只采用一种卷积核,即对于特定任务特定模型,卷积核大小是确定的,很少考虑多个卷积核的作用。我们在看不同尺寸不同远近的物体时,视觉皮层神经元接受域大小是会根据刺激来进行调节的。作者提出了一种在CNN中对卷积核的动态选择机制,该机制允许每个神经元根据原创 2021-08-17 13:59:21 · 741 阅读 · 0 评论 -
SENet(2017)
卷积核作为卷积神经网络的核心,通常被看作是在局部感受野上,将空间上(spatial)的信息和特征维度上(channel-wise)的信息进行聚合的信息聚合体。卷积神经网络由一系列卷积层、非线性层和下采样层构成,这样它们能够从全局感受野上去捕获图像的特征来进行图像的描述。去学到一个性能非常强劲的网络是相当困难的,从空间维度层面来提升网络的性能,如Inception结构中嵌入了多尺度信息,聚合多种不同感受野上的特征来获得性能增益;在Inside-Outside网络中考虑了空间中的上下文信息;将Attenti原创 2021-08-17 10:53:14 · 224 阅读 · 0 评论 -
Involution-Convolution
参考资料Involution:Inverting the Inherence of Convoution for Visual Recognition(2021)d-li14/involutionInvolution(附对Involution的思考):港科大、字节跳动、北大提出“内卷”神经网络算子,在CV三大任务上提点明显...原创 2021-08-16 17:16:01 · 923 阅读 · 1 评论 -
二维码检测定位
条码条码分为一维条码、二维条码和三维条码。一维条码(Bar Code)一维条码是由一组粗细不同、黑白(或彩色)相间的条、空及其相应的字符(数字字母)组成的标记,即传统条码。是将宽度不等的多个黑条和空白,按照一定的编码规则排列,用以表达一组信息的图形标识符。常见的条形码是由反射率相差很大的黑条(简称条)和白条(简称空)排成的平行线图案。二维条码(QR Code,Quick Response Code)二维条码简称为二维码,是用某站特定的几何图形按一定规律在平面(二维方向上)分布的黑白相间原创 2021-07-27 15:06:14 · 11266 阅读 · 1 评论 -
图像风格化——感知损失(perceptual loss)(2016)
[paper]Perceptual Losses for Real-Time Style Transfer and Super-Resolution(2016)Perceptual Losses for Real-Time Style Transfer and Super-Resolution:Supplementary Material《Loss Functions for Image Restoration with Neural Networks》中对图像复原任务中的损失函数进行了比较,指出了L2原创 2021-07-16 14:09:51 · 8153 阅读 · 0 评论 -
降采样-升采样
降采样深度卷积神经网络中降采样的方法:stride大于1的poolingstride大于1的convstride大于1的reorg(reorganization改组整顿),由Joseph Redmond在YOLOv2中首次提出。conv用stride=2的conv降采样的卷积神经网络效果与使用pooling降采样的卷积神经网络效果相当;卷积神经网络小的时候,使用pooling降采样效果可能更好,卷积神经网络大的时候,使用stride=2的conv降采样效果更好。poolingpoolin原创 2021-06-29 16:23:37 · 2418 阅读 · 0 评论 -
DeepLab2:用于深度标记的TensorFlow库(2021)
DeepLab2: A TensorFLow Library for Deep LabelingDeepLab2 是一个用于深度标注的 TensorFlow 库,旨在为密集像素标注任务提供统一的、最先进的 TensorFlow 代码库,包括但不限于语义分割、实例分割、全景分割、深度估计,甚至 视频全景分割。深度标记是指通过深度神经网络为图像中的每个像素分配预测值来解决计算机视觉问题。只要感兴趣的问题可以用这种方式表述,DeepLab2 就应该达到目的。此外,此代码库包括我们最近的和最先进的深度标签研究模原创 2021-06-24 09:36:42 · 2917 阅读 · 0 评论 -
《生成对抗网络入门指南》—读书笔记
机器学习的研究旨在让计算机学会学习,能够模拟人类的学习行为,建立学习能力,用学习出来的思维模型对真实事件做出决策和预测。原创 2021-06-01 15:00:31 · 425 阅读 · 0 评论 -
face parsing label
CelebAMask-HQface-parsing.PyTorch原创 2021-05-13 10:08:45 · 621 阅读 · 0 评论 -
StyleMapGAN: Exploiting Spatial Dimensions of Latent in GAN for Real-time Image Editing(2021)
[paper] Exploiting Spatial Dimensions of Latent in GAN for Real-time Image Editing[code] StyleMapGAN摘要生成对抗网络(GAN)从随机潜在向量合成逼真的图像。尽管操纵潜矢量控制了合成输出,但是用GAN编辑真实图像的缺点是:i)耗时的优化,无法将真实图像投影到潜矢量; ii)或通过编码器嵌入不准确。我们提出StyleMapGAN:中间潜在空间具有空间维度,而空间变异调制取代了AdaIN。与现有的基于优化的原创 2021-05-07 13:17:35 · 2263 阅读 · 2 评论 -
Image Manipulation:StyleGAN2 Distillation for Feed-forward Image Manipulation(2020)
StyleGAN2 Distillation for Feed-forward Image Manipulationstylegan2-distillation原创 2021-04-30 17:06:14 · 608 阅读 · 0 评论 -
基于图像的虚拟试衣:Parser-Free Virtual Try-On via Distilling Appearance Flows(2021)
PaperParser-Free Virtual Try-On via Distilling Appearance Flows算法比较WUTON和PF-AFN比较WUTON 通过训练基于人体分析的老师网络来指导学生网络,让学生网络模拟基于人体分析的老师网络。学生网络输入中除外没有人体分析,老师网络和学生网络结构的输入输出完全相同。PF_AFN 学生网络和导师网络的输入输出完全不一样。学生网络的输入是导师网络的输出,输入的衣服图像是导师网络输入真人身上的真实衣服。将试衣问题的知识提取公原创 2021-03-29 17:29:17 · 1785 阅读 · 0 评论 -
移动高清适配
像素CSS像素在CSS中,使用px作为单位,该px和物理像素并不是相等的,是相对的关系。CSS中的像素只是一个抽象的单位,在不同的设备或不同的环境中,CSS中的1px所代表的物理像素是不同的。在PC端,CSS的1px一般对应着电脑屏幕的1个物理像素,但在移动端,CSS的1px等于几个物理像素是和屏幕像素密度有关的。CSS的1px等于几个物理像素,除了和屏幕密度dpr有关,还和用户缩放有关系。例如,当用户把页面放大一倍,那么CSS中1px所代表的物理像素也会增加一倍;反之把页面缩小一倍,CSS中1p原创 2021-03-03 14:47:08 · 149 阅读 · 0 评论 -
图像隐形水印
被保护的图片——隐形水印原创 2021-02-18 17:28:56 · 583 阅读 · 0 评论 -
仿射变换
仿射变换=线性变换+平移线性变换几何描述变换前是直线的,变换后依然是直线直线比例保持不变变换前是原点的,变换后依然是原点代数描述线性变换是通过矩阵乘法来实现的。例子旋转推移旋转和推移叠加仿射变换几何描述变换前是直线的,变换后依然是直线直线比例保持不变代数描述仿射变换是通过矩阵乘法和矩阵加法来实现的。y⃗=Ax⃗+b⃗\vec{y}=A \vec{x} + \vec{b}y=Ax+b例子平原创 2021-02-02 11:58:02 · 4829 阅读 · 1 评论 -
Photoshop图层混合算法
Photoshop中图层面板右上角的混合模式,及分类。基色:图像中原稿颜色,对应Photoshop中 当前图层下方的颜色。文中用A表示。混合色:通过绘图或编辑工具应用的颜色,对应Photoshop中当前图层的颜色。文中用B表示,文中混合色值均为(128,128, 128)。结果色:混合后得到的颜色,对应Photoshop中使用模式之后出现的混合图层的颜色。文中用C表示。图层的透明度: 蒙版图层中给定位置图层的亮度(d=颜色值/255),文中用d表示。基础模式利用图层的不透明度及图像填充值来原创 2021-01-22 17:32:57 · 1602 阅读 · 1 评论 -
图像矩阵加减操作后出现异常值问题
OpenCV图像加减函数方法图像矩阵的加减操作转换为OpenCV图像加(add)减(subtract)函数操作。def bilateral_filter(image, level1=3, level2=1): img_smooth = cv2.bilateralFilter(image, level1 * 5, level1 * 12.5, level1 * 12.5) img_diff = cv2.subtract(img_smooth, image) img_hp = cv.原创 2021-01-18 15:34:44 · 353 阅读 · 1 评论 -
人脸美颜算法
人脸美颜算法美颜的目的就是要让人看起来更美,包括:皮肤细腻、白皙、光滑、脸部各个器官及脸型可以进行细致的调整,通过美妆调节可以叨叨快速上妆的效果。人脸美颜效果,从技术上主要通过四个关键步骤实现。获取人脸关键点信息美颜处理依赖于人脸关键点信息,基于这些关键点,可以精确的知道脸部各个器官的位置信息,从而进行美化处理。人脸关键点基本信息主要包括眉毛、眼睛、嘴巴、脸部外轮廓等关键点。基于检测的关键点对脸部关键点进行稠密化处理,插入额外的关键点,如额头区域和脸部外围限制区域,使其能够覆盖整个脸部区域。原创 2021-01-14 13:12:01 · 10973 阅读 · 0 评论 -
颜色查找表LUT
查找表(LUT,LookUp Table)是图像颜色转换的强大工具,在许多图形和视频编辑器中使用。2D LUTCLUT-from-images2D LUT生成def generate_identify_color_matrix(width, height, channel): img = np.zeros((width, height, channels), dtype=np.uint8) for by in range(8): for bx in range(8):原创 2021-01-13 17:30:32 · 7238 阅读 · 1 评论 -
seam carving
Seam Carvingandrewdcampbell/seam-carving17. 如何通过缝隙雕刻图像:Seam Carving原创 2021-01-06 17:05:55 · 2027 阅读 · 0 评论 -
图像合成-图像融合-纹理合成-图像缝隙应用
20. 用于纹理合成和转移的图像缝合原创 2021-01-06 16:15:39 · 736 阅读 · 0 评论 -
PIL模块中ImageEnhance图像增强
PIL模块中ImageEnhance图像增强色度(ImageEnhance.Color):调整图像的颜色均衡,增强因子为0.0将产生黑白图像,增强因子为1.0是原始图像,增强因子大于1.0,图像的颜色饱和度依次增大,增强因子小于1.0图像的颜色饱和度依次减小。enh_col = ImageEnhance.Color(image)image_colored = enh_col.enhance(1.5)亮度(ImageEnhance.Brightness):调整图像的亮度,增强因子为0.0将产原创 2021-01-06 15:51:30 · 1484 阅读 · 0 评论