昇腾应用案例体验:(9) 黑白图像上色

昇腾AI应用,探索人工智能的无限可能,使能千行百业


黑白图像上色

概述

黑白图像上色模型原理如下图所示,对物件包括背景色(L通道代表的灰度图)使用卷积运算提取特征,然后同样用卷积进行分类,从而尝试给出对灰度图片每个像素点的色彩预期(ab通道)。将ab通道的值Resize到原始图片宽高并与L通道叠加后,转为RGB图片即可得到彩色图像。黑白图像上色模型原理如下图所示,对物件包括背景色(L通道代表的灰度图)使用卷积运算提取特征,然后同样用卷积进行分类,从而尝试给出对灰度图片每个像素点的色彩预期(ab通道)。将ab通道的值resize到原始图片宽高并与L通道叠加后,转为RGB图片即可得到彩色图像。

其中模型的输入为L通道的数据(224,224,1),输出为ab通道的数据(56,56,2)。

如下图所示,昇腾软件栈中存在一个atc模型转换工具,针对本应用,我们需要使用该工具将原始模型转换成系统支持的om模型。

本应用采用了下图所示的模块化设计,通过各模块之间的协调配合完成一张图片的推理输出。

其中各个模块的主要功能点如下所示:

  • 1.运行管理资源申请:用于初始化系统内部资源,固定的调用流程。
  • 2.加载模型文件并构建输出内存:从文件加载离线模型数据,需要由用户自行管理模型运行的内存,根据内存中加载的模型获取模型的基本信息包含模型输入、输出数据的数据buffer大小;由模型的基本信息构建模型输出内存,为接下来的模型推理做好准备。
  • 3.数据预处理:接收外界传递的图像数据,对读入的图像数据进行预处理,然后构建模型的输入数据。
  • 4.模型推理:根据构建好的模型输入数据进行模型推理。
  • 5.解析推理结果:根据模型输出,解析模型的推理结果。使用OpenCV将转换后的彩色图像数据保存成图片文件。

模型原始链接: https://github.com/richzhang/colorization

图像预处理

本应用图像预处理部分,使用OpenCV的imread接口读取图片,读取出来的是BGR格式。模型输入为224×225,因此需要把读取到的图像Resize到224×224。Resize后对数据做归一化处理。如算法设计部分所言,该模型采用Lab色彩空间,因此需要把BGR格式转为Lab格式数据。该模型用L通道数据预测出可能的ab空间数据,所以要从Lab数据中分离出L通道数据。再对所得的数据减均值,即可得到模型需要的输入数据。

模型推理结果后处理

模型推理得到预测出的ab空间数据。首先把得到的数据resize回原图像大小,然后和原图像L通道数据合并,即得到完整Lab图像。把Lab图像转回BGR格式即可保存为jpeg图片,得到上色后的图像。

效果展示

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值