PIL--Pillow学习记录

最新推荐文章于 2023-10-31 16:18:31 发布
weixin_44140703
最新推荐文章于 2023-10-31 16:18:31 发布
阅读量245
点赞数 1
分类专栏： python学习学习总结文章标签： python 图像识别
本文链接：https://blog.csdn.net/weixin_44140703/article/details/112647815
版权
学习总结同时被 2 个专栏收录
20 篇文章 0 订阅
订阅专栏
python学习
6 篇文章 1 订阅
订阅专栏
import cv2
import numpy as np
from PIL import Image, ImageDraw, ImageFont, ImageWin


"""
Python Pillow(PIL)库的用法介绍
Pillow库是一个Python的第三方库。

在Python2中，PIL(Python Imaging Library)是一个非常好用的图像处理库，但PIL不支持Python3，所以有人(Alex Clark和Contributors)提供了Pillow，可以在Python3中使用。

官方文档路径：https://pillow.readthedocs.io/en/latest/

一、安装Pillow

pip install pillow
Pillow库安装成功后，导包时要用PIL来导入，而不能用pillow或Pillow。

import PIL
from PIL import Image
在Pillow库中，除了有二十多个模块，还支持非常多的插件。其中最常用的是Image模块中同名的Image类，其他很多模块都是在Image模块的基础上对图像做进一步的特殊处理，Image模块中会导入部分来使用。本文介绍Image模块的常用方法。

1. PIL库读图，转为numpy：np.array()

2. opencv读入的图像是BGR格式，转为RGB：img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)

3. opencv保存时，路径不能是中文！！！否则不报错但是也保存不了！！！

4. 保存图片的路径：'D:/Face Recognition/CASIA-WebFace-aligned',注意是 /，\\也行，但是有个潜在的问题，利用os.path.join()后，路径会自动变成 \ 。这也不报错，但也保存不了图片！！！所以保存时要使用 / ，并且不要使用os.path.join()！！！

5. matpotlib.pyplot保存Image读入的图为jpg格式时会报错：RGBA不能存为RGB！  所以只能存为png格式。但是利用cv2.imwrite可以保存。

6. 读入图片时，要注意有的图像可能是1通道的灰度图。这时如果要训练的话，3通道和1通道无法构成批量来训练。解决方法：使用cv2读入，默认是3通道。如果利用PIL的Image，可以这样写：
img = Image.open(self.root+'/'+img_path).convert('RGB')

或者手动复制三个通道修改成3通道图像：
img = np.stack([img]*3, 2)

1. OpenCV读取图片的格式和PIL不一样，OpenCV是BGR格式，PIL是RGB格式

2. PIL的Image.open()读入图片后并不是numpy数组array格式，这对于后面图像处理以及神经网络读入图片数据会带来麻烦，
    例如用卷积神经网络读入输入图片给placeholder时，往往要将代表图片的矩阵形状进行转换，此时PIL的Image.open()读入的格式是不能用reshape方法的。
    处理方式其实很简单，用np.array()函数直接进行转换就可以。
    示例：
    img = Image.open(path)
    re_img = np.asarray(img)

    将变成array的图片矩阵变回Image对象，使用Image中的fromarray方法
    示例：
    Image.fromarray(re_img)
3. ImageDraw模块提供了图像对象的简单2D绘制。用户可以使用这个模块创建新的图像，注释或润饰已存在图像，为web应用实时产生各种图形。


"""
class Aa(object):

    def draw_font_blend(self):
        """
        含义：创建一个可以在给定图像上绘图的对象。
        注意：图像内容将会被修改。

        首先，通过ImageDraw类创建一个绘制对象draw;

        draw.line()：直线的绘制，第一个参数指定的是直线的端点坐标，形式为（x0, y0, x1, y1），第二个参数指定直线的颜色；
        draw.rectangle()：矩形绘制，第一个参数指定矩形的对角线顶点（左上和右下），形式为（x0, y0, x1, y1），第二个指定填充颜色，第三个参数指定边界颜色；
        draw.arc()：（椭）圆弧的绘制，第一个参数指定弧所在椭圆的外切矩形，第二、三两个参数分别是弧的起始和终止角度， 第四个参数是填充颜色，第五个参数是线条颜色；
        draw.chord()：弦的绘制，和弧类似，只是将弧的起始和终止点通过直线连接起来；
        draw.pieslice()：圆饼图的绘制，和弧与弦类似，只是分别将起始和终止点与所在（椭）圆中心相连；
        draw.ellipse()：椭圆的绘制，第一个参数指定椭圆的外切矩形， 第二、三两个参数分别指定填充颜色和线条颜色，当外切矩形是正方形时，椭圆即为圆；
        draw.polygon()：绘制多边形，第一个参数为多边形的端点，形式为（x0, y0, x1, y1, x2, y2,……），第二、三两个参数分别指定填充颜色和线条颜色；
        draw.text()：文字的绘制，第一个参数指定绘制的起始点（文本的左上角所在位置），第二个参数指定文本内容，第三个参数指定文本的颜色，第四个参数指定字体（通过ImageFont类来定义）。
        :return:
        """
        img = Image.open("11111.jpg")
        img_copy = img.copy()
        img_draw = ImageDraw.Draw(img_copy)
        # draw.line()：直线的绘制，第一个参数指定的是直线的端点坐标，形式为（x0, y0, x1, y1），第二个参数指定直线的颜色；width 线宽度
        img_draw.line((0, 0, 500, 500), (0, 255, 255), width=10)
        # draw.polygon()：绘制多边形，第一个参数为多边形的端点，形式为（x0, y0, x1, y1, x2, y2,……），第二、三两个参数分别指定填充颜色和线条颜色；
        img_draw.polygon((100, 100, 500, 150, 600, 450, 110, 550), outline="red", fill="blue")
        img_draw.polygon([(500, 500),(1000, 500),(1200, 1200),(600, 1300)], fill="green")

        # draw.rectangle()：矩形绘制，第一个参数指定矩形的对角线顶点（左上和右下），形式为（x0, y0, x1, y1），第二个指定填充颜色，第三个参数指定边界颜色；
        img_draw.rectangle([(800,1800),(2000, 4000)], fill="red")

        # draw.text()：文字的绘制，第一个参数指定绘制的起始点（文本的左上角所在位置），第二个参数指定文本内容，第三个参数指定文本的颜色，第四个参数指定字体（通过ImageFont类来定义）。
        font = ImageFont.truetype("consola.ttf", 100, encoding="utf-8") # 设置字体
        img_draw.text((800, 1700), "888", 'fuchsia', font)
        # 使用给定的两张图像及透明度变量alpha，插值出一张新的图像。这两张图像必须有一样的尺寸和模式。
        #   合成公式为：out = image1 (1.0 - alpha) + image2  alpha
        # 若变量alpha为0.0，返回第一张图像的拷贝。若变量alpha为1.0，将返回第二张图像的拷贝。对变量alpha的值无限制。
        new_img = Image.blend(img, img_copy, 0.5)
        new_img.show()


    def open_img(self):
        """
        1. 打开本地图片
        open(fp, mode='r'): 打开一张图片，是Image模块中的函数。如果图片与当前代码在同一目录下，可以只写图片的文件名，其他情况需要拼接图片的路径。mode默认为'r'，也必须为'r'。
        show(): 调用图片显示软件打开图片。打开后程序会阻塞，需要手动关闭。
        :return:
        """
        img = Image.open("11111.jpg")
        img.show()

    def creat_img(self):
        """
        2. 创建一张新图片
        new(mode, size, color=0): 创建一张图片(画布)，用于绘图，是Image模块中的函数。有3个参数。
        mode, 图片的模式，如“RGB”(red,green,blue三原色的缩写，真彩图像)、“L”(灰度，黑白图像)等。
        size, 图片的尺寸。是一个长度为2的元组(width, height)，表示的是像素大小。
        color, 图片的颜色，默认值为0表示黑色。可以传入长度为3的元组表示颜色，也可以传入颜色的十六进制，在版本1.1.4后，还可以直接传入颜色的英文单词，如上面代码中的(0, 0, 255)可以换成‘#0000FF’或‘blue’，都是表示蓝色。
        :return:
        """
        img = Image.new("RGB", (200, 200), "blue")
        img.show()

    def copy_and_paste(self):
        """
        copy(): 拷贝当前的图片，拷贝出来的图片与原图一模一样。如果想在图片上粘贴一些内容，又想保留原图时，可以使用此方法。

        paste(im, box=None, mask=None): 将另一张图片粘贴到当前图片中，如果粘贴的模式不匹配，则将被粘贴图片的模式转换成当前图片的模式。有3个参数。
            im, 被粘贴的图片。传入一张图片，当第二个参数box指定的是一个区域时，im参数也可以是一个整数或颜色值(元组表示，16进制表示和颜色名都可以，如上面代码中的image_new可以换成(0, 0, 255), '#0000FF', 'blue')。
            box, 图片粘贴的位置或区域。传入一个长度为2或4的元组，如果不传值，默认为(0, 0)，图片被粘贴在当前图片的左上角。如果传入长度为2的元组(x, y)，表示被粘贴图片的左上角坐标位置。如果传入长度为4的元组(x0, y0, x1, y1)，
        表示图片粘贴的区域，此时区域的大小必须与被粘贴图片一致，否则会报错，传入的元组长度为其他值也会报错。
            mask, 蒙版。传入一张与被粘贴图片尺寸一样的图片，可以使用模式为'1'、'L'或者'RGBA'的图像。如果mask图像的颜色值为255，则直接按被粘贴图片的颜色粘贴，如果mask图像的颜色值为0，则保留当前图片的颜色(相当于没有粘贴)，
        如果mask图像的颜色值为0~255之间的值，则将im与mask进行混合后再粘贴。

        save(fp, format=None, **params): 将当前图片按指定的文件名保存，运行后会将图片按新名字保存在当前路径下(也可以指定路径)。文件名最好带扩展名，方便打开，format表示图片的格式，
        没有指定format则会根据扩展名来解析(如果能解析出来)，一般不需要指定format，传入一个带扩展名的文件名即可。
        :return:
        """
        img = Image.open("40.jpg")
        img_copy = img.copy()
        # img_copy.show()
        img_new = Image.new("RGB", (200, 200), (1,1,1))
        img_new2 = Image.new("L", (200, 200), '#646464')
        img_copy.paste(img_new, (100, 100), mask=img_new2)
        img_copy.save("pil.png")

        img_copy2 = Image.open("pil.png")
        print(img_copy2.format, img_copy2.mode)
        img_copy.show()

    def crop(self):
        """
        crop(box=None): 裁剪图片，返回裁剪区域的图片。box表示裁剪的区域，传入长度为4的元组(x0, y0, x1, y1)，不传默认为拷贝原图，相当于copy()方法，如果裁剪的区域超过了原图的区域，超出部分用像素格填充。

        resize(size, resample=BICUBIC, box=None, reducing_gap=None): 缩放图片，返回缩放后的图片副本。有4个参数。
            size, 图片缩放后的尺寸，传入一个长度为2的元组(width, height)。
            resample, 重采样，是一个可选的重采样过滤器。可以传入Image.NEAREST, Image.BOX, Image.BILINEAR, Image.HAMMING, Image.BICUBIC, Image.LANCZOS。默认为Image.BICUBIC。如果图像的模式为'1'或'P'，则始终设置为Image.NEAREST。
            box, 缩放图片的区域。传入长度为4的元组(x0, y0, x1, y1)，这个区域必须在原图的(0, 0, width, height)范围内，如果超出范围会报错，如果不传值则默认将整张原图进行缩放。
            reducing_gap, 减少间隙。传入一个浮点数，用于优化图片缩放效果，默认不进行优化，值大于3.0时优化效果基本已经是公平的重采样。
        Image模块还有很多对图片处理的方法和函数，了解更多可以参考：https://blog.csdn.net/weixin_43790276/article/details/108673454
        :return:
        """
        img = Image.open("888.jpg")
        img_crop = img.crop(box=(200, 200, 400, 400))
        img_crop.show()

        img_resize = img.resize((500, 400), resample=Image.LANCZOS, reducing_gap=5.0)
        img_resize.show()


    def attribute(self):
        """
        width属性表示图片的像素宽度，height属性表示图片的像素高度，width和height组成了size属性，size是一个元组。
        mode属性表示图片的模式，如RGBA，RGB，P，L等。
        format属性表示图片的格式，格式一般与图片的后缀扩展名相关。category属性表示图片的的类别。
        readonly属性表述图片是否为只读，值为1或0，表示的是布尔值。
        info属性表示图片的信息，是一个字典。
        """
        img = Image.open("9999.jpg")
        print("width", img.width)
        print("heigth", img.height)
        print("size", img.size)
        print("format", img.format)



    def mode(self):
        """
        图片有很多模式，支持以下标准模式，参考：https://pillow.readthedocs.io/en/latest/handbook/concepts.html#concept-modes
        mode	描述
        1	1位像素，黑白，每字节存储一个像素
        L	8位像素，黑白
        P 	8位像素，使用调色板映射到任何其他模式
        RGB 	3x8位像素，真彩
        RGBA 	4x8位像素，带透明蒙版的真彩
        CMYK 	4x8位像素，分色
        YCbCr 	3x8位像素，彩色视频格式
        LAB 	3x8位像素，L * a * b颜色空间
        HSV 	3x8位像素，色相，饱和度，值颜色空间
        I 	32位有符号整数像素
        F 	32位浮点像素
        1位像素的范围是0-1，0表示黑1表示白，中间表示灰。8位像素的范围是0-255，如RGB的(0, 0, 0)表示黑，(255, 255, 255)表示白，依此类推。

        2. 图片的模式转换

        :return:
        """
        img = Image.open("666.jpg")
        print(img.mode)
        img1 = img.convert("1")
        print(img1.mode)
        img1.show()
        imgL = img.convert("L")
        print(imgL.mode)
        imgL.show()
        imgP = img.convert("P")
        print(imgP.mode)
        imgP.show()

    def aa(self):
        # cv2读取
        img = cv2.imread("888.jpg")
        # cv2.cvtColor(img, cv2.COLOR_BGR2RGB) 转化为rgb   Image.fromarray() 格式转化为PIL能识别的格式
        img = Image.fromarray(cv2.cvtColor(img, cv2.COLOR_BGR2RGB))
        img_new = img.copy()
        # ImageDraw模块提供了图像对象的简单2D绘制。用户可以使用这个模块创建新的图像，注释或润饰已存在图像，为web应用实时产生各种图形。 Draw（）创建一个可以在给定图像上绘图的对象。
        draw_img = ImageDraw.Draw(img_new)
        # 根据四个点坐标画框，用颜色填充。
        draw_img.polygon([(200, 200), (800, 200), (800, 800), (200, 800)], fill=(222, 111, 0))
        # 根据四个点，画线框，outline为线框颜色
        # draw_img.polygon([200, 300, 100, 300, 400, 500, 800, 600], outline=(222, 111, 0))
        # 图像合成 两张图片合成，0.5为不透明度，值越大，越不透明
        font = ImageFont.truetype("./doc/simfang.ttf", 10, encoding="utf-8")
        draw_img.text([100, 100], "888", fill=(0, 0, 0), font=font)
        new_img = Image.blend(img, img_new, 0.5)
        # 转化为array格式后，opencv可以读取
        new_img = np.array(new_img)
        # 改变尺寸，按比例缩放
        new_img = cv2.resize(new_img, (0, 0), fx=0.2, fy=0.2, interpolation=cv2.INTER_NEAREST)
        cv2.imshow("aaa",new_img)
        cv2.waitKey(0)



if __name__ == '__main__':
    a = Aa()
    a.draw()
weixin_44140703
关注
1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
PIL--Pillow学习记录

import cv2import numpy as npfrom PIL import Image, ImageDraw, ImageFont, ImageWin"""Python Pillow(PIL)库的用法介绍Pillow库是一个Python的第三方库。在Python2中，PIL(Python Imaging Library)是一个非常好用的图像处理库，但PIL不支持Python3，所以有人(Alex Clark和Contributors)提供了Pillow，可以在Python3中使
复制链接

扫一扫