豆酱踩坑（一）—— python 图片保存与显示

最新推荐文章于 2024-06-21 11:05:32 发布

一豆豆酱

最新推荐文章于 2024-06-21 11:05:32 发布

阅读量3.2k

点赞数

分类专栏： Python基础

本文链接：https://blog.csdn.net/qq_44965314/article/details/104793253

版权

Python基础专栏收录该内容

8 篇文章 0 订阅

订阅专栏

编程小白最近跑程序，自己读数据集，大大小小的坑踩了无数。。
汇总一下吧~~

1. 使用save命令保存图片

img.save(img_path, optimize=True)
	
注：是针对Image格式的图片，数组形式的图片不能这么保存
    可以使用 img = Image.fromarray(img) 将数组类型转换成Image格式
    0-1之间的浮点数是不能保存成Image格式的

2. 使用opencv保存图片

import cv2
cv2.imwrite(img_path, img)

即使是0-1之间的浮点数，也可以用该方法进行保存，但会变成全黑的图片
img= img*255 
将像素值乘255，就可以恢复彩色图片了。

用 skimage.util.random_noise(img, mode=‘gaussian’) 将图片进行加高斯噪声处理后，图片变成0-1浮点数了，就得用cv2保存图片了。

3. plt.savefig() 保存图片
使用 plt 保存图片时需要关闭坐标轴，以及去除掉图片周围的空白部分

plt.figure()
plt.imshow(img)
plt.axis('off')  # 关闭坐标轴
plt.savefig(filename, bbox_inches='tight', pad_inches=0)

其中最重要的参数就是bbox_inches='tight'和pad_inches=0，如果想修改图片的分辨率可以使用plt.savefig中的dpi参数，图片的大小就可以发生变化了。

该方法用来保存伪彩图真的巨好用！！！

4. 图片保存格式

图片保存成png还是jpg，也纠结了好久。只知道png的精度要比jpg高，后来踩了一个大坑才知道jpg是会修改像素值的。（这个大坑就是——我要做语义分割任务，jpg把标签改了。。）
所以经过处理的图片还是保存成png格式吧。。

关于png是3通道还是4通道：

使用上述两种方法保存的png图片还是3通道的，读取之后可以直接送入神经网络
(“直接”是指：经过transpose（H,W,C） => (C,H,W) 和torch.tensor() )
如果是一个未知的png，（比如截屏保存），那么可能就是4通道的，输入网络之前需要压缩成3通道

from PIL import Image
# 通道转换
def change_image_channels(image, image_path):
    # 4通道转3通道
    if image.mode == 'RGBA':
        r, g, b, a = image.split()
        image = Image.merge("RGB", (r, g, b))
        image.save(image_path)
    #  1 通道转3通道
    elif image.mode != 'RGB':
        image = image.convert("RGB")
        os.remove(image_path)
        image.save(image_path)
    return image
 
# 图片压缩
def image_compression(image):
     w, h = image.size
     print(w, h)
     image.thumbnail((int(w / 1.1), int(h / 1.1)))
     image.save("./car.png")
    return image
 
if __name__ == "__main__":
    image = Image.open("./timg.png")
    new_image = process_image_channels(image, "./time.png")
    print(new_image.mode)

代码参考：https://blog.csdn.net/Areigninhell/article/details/86505961

5. 图片显示

我不太习惯用opencv显示图片，RGB会变成BRG，一般都是用plt

from matplotlib import pyplot as plt
plt.figure()
plt.imshow(img)
plt.show()

如果图片是uint8（0-255）会正常显示，
如果图片是浮点型0-255 会变成白图，img /= 255，变成0-1之间的浮点型就可以正常显示啦。
（输入到神经网络中，input和weight需要保持同类型，为了图片正常显示，需要除以255）

6. 保存16位的图片
深度图有时为了保存精度，需要保存成16位的图片（像素*1000 可以实现原图保存到小数点后三位）。
安装 numpngw 函数库

import numpngw
depth = (depth * 1000).astype(np.uint16)
numpngw.write_png('demo.png', depth)

亲测 Image.open()可以正常读取图片，用cv2.imread() 记得要打开图片原始的格式 —— img = cv2.imread(img_path, -1) ( ‘-1’ 表示图片的原始格式)

一豆豆酱

关注

0
点赞
踩
15

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录