python图像处理opencv笔记（三）：图像处理

最新推荐文章于 2024-04-20 16:19:52 发布

submarineas

最新推荐文章于 2024-04-20 16:19:52 发布

阅读量408

点赞数

分类专栏： opencv 文章标签： opencv 图像识别 python

本文链接：https://blog.csdn.net/submarineas/article/details/108458172

版权

opencv 专栏收录该内容

13 篇文章 4 订阅

订阅专栏

引言

本篇主要想总结一下关于图像相关方面第三个知识点，为图像的一些基本处理。

图像处理

灰度图与阈值

import cv2 #opencv读取的格式是BGR
import numpy as np
import matplotlib.pyplot as plt#Matplotlib是RGB
%matplotlib inline 

img=cv2.imread(r'./1200/picture4.jpg')
img_gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
img_gray.shape	
"""
(1200, 1920)
"""

hsv=cv2.cvtColor(img,cv2.COLOR_BGR2HSV)
cv2.imshow("hsv", hsv)
cv2.waitKey(0)    
cv2.destroyAllWindows()

其中HSV(Hue, Saturation, Value)是根据颜色的直观特性由A. R. Smith在1978年创建的一种颜色空间, 也称六角锥体模型(Hexcone Model)。这个模型中颜色的参数分别是：色调（H），饱和度（S），明度（V）。

图像阈值

ret, dst = cv2.threshold(src, thresh, maxval, type)

src：输入图，只能输入单通道图像，通常来说为灰度图
dst：输出图
thresh：阈值
maxval：当像素值超过了阈值（或者小于阈值，根据type来决定），所赋予的值
type：二值化操作的类型，包含以下5种类型： cv2.THRESH_BINARY； cv2.THRESH_BINARY_INV； cv2.THRESH_TRUNC； cv2.THRESH_TOZERO；cv2.THRESH_TOZERO_INV
cv2.THRESH_BINARY 超过阈值部分取maxval（最大值），否则取0
cv2.THRESH_BINARY_INV THRESH_BINARY的反转
cv2.THRESH_TRUNC 大于阈值部分设为阈值，否则不变
cv2.THRESH_TOZERO 大于阈值部分不改变，否则设为0
cv2.THRESH_TOZERO_INV THRESH_TOZERO的反转

可以测试，代码为：

ret, thresh1 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_BINARY)
ret, thresh2 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_BINARY_INV)
ret, thresh3 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_TRUNC)
ret, thresh4 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_TOZERO)
ret, thresh5 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_TOZERO_INV)

titles = ['Original Image', 'BINARY', 'BINARY_INV', 'TRUNC', 'TOZERO', 'TOZERO_INV']
images = [img, thresh1, thresh2, thresh3, thresh4, thresh5]

for i in range(6):
    plt.subplot(2, 3, i + 1), plt.imshow(images[i], 'gray')
    plt.title(titles[i])
    plt.xticks([]), plt.yticks([])
plt.savefig('test.jpg')
plt.show()

在这里插入图片描述

图像标注

import cv2
import numpy
 
cv2.namedWindow("Image") #创建窗口
 
img = cv2.imread(r'./1200/picture4.jpg') #读取图像
 
cv2.line(img,(50,50),(300,300),(255,0,0),2) #画直线
 
cv2.rectangle(img,(500,20),(580,100),(0,255,0),-1)  #画矩形
 
cv2.circle(img,(500,300),40,(255,255,0),-1) #画圆形
 
pts = numpy.array([[300,300],[300,340],[350,320]],numpy.int32)  #用numpy形成坐标列表
cv2.polylines(img,[pts],True,(0,255,255),2)  #画多边形
font = ImageFont.truetype('simhei.ttf',30,encoding='utf-8')

cv2.putText(img,'测试',(350,420),cv2.FONT_HERSHEY_SIMPLEX,1,(255,232,133),2)

cv2.imshow('Image',img)
cv2.imwrite('test.jpg',img,[int(cv2.IMWRITE_JPEG_QUALITY),70])
cv2.waitKey(0)
cv2.destroyWindow("Image")  #关闭窗口

在这里插入图片描述

opencv 提供了绘制直线、圆形、矩形等基本绘图的功能

绘直线
cv2.line(画布,起点坐标，终点坐标，颜色，宽度)

例如：
cv2.line(image,(20,60),(300,400),(0,0,255),2)
绘矩形
cv2.rectange(画布，起点，终点，颜色，宽度)

若宽度大于0，标识边线宽度；如果小于0，表示画实心矩形
cv2.rectange(image,(20,60),(300,400),(255,0,0),-1)
绘圆形
cv2.circle(画布，圆心坐标，半径，颜色，宽度)

若宽度大于0，标识边线宽度；如果小于0，表示画实心圆行
cv2.circle(image,(300,300),40,(0,255,0),2)
绘多边形
cv2.polylines(画布，点坐标列表，封闭，颜色，宽度)

点坐标列表是一个numpy类型的列表，需要导入numpy 包

import numpy
pts = numpy.array([[20,60],[300,280],[150,200]],numpy.int32)	# 创建点坐标
cv2.rectange(image,[pts],True,(0,0,255),2)

添加文字
cv2.putText(画布，文字，位置，字体，大小，颜色，文字粗细)

cv2.FONT_HERSHEY_SIMPLEX 正常尺寸的sans-serif字体
cv2.FONT_HERSHEY_SPLAIN 小尺寸的sans-serif字体
cv2.FONT_HERSHEY_COMPLEX 正常尺寸的serif字体
cv2.FONT_HERSHEY_SCREIPT_SIMPLEX 手写字体风格

这里有一个问题是中文出现了乱码，左边小姐姐头上出现了 ? 号，要解决这个问题可以使用 freetype 模块，在python3已经提供了pip的安装方式，但我看网上资料很少，大部分还是选择用pillow，那么代码如下：

from PIL import Image,ImageDraw,ImageFont
import cv2
import numpy as np
# 读取文件
#pil_img = Image.open('1.jpg',)
# 读取cv2文件
pil_img = Image.fromarray(cv2.cvtColor(img, cv2.COLOR_BGR2RGB))
# pil_img.show()
# 生成画笔
draw = ImageDraw.Draw(pil_img)
# 第一个参数是字体文件的路径，第二个是字体大小
font = ImageFont.truetype('simhei.ttf',60,encoding='utf-8')
# 第一个参数是文字的起始坐标，第二个需要输出的文字，第三个是字体颜色，第四个是字体类型
draw.text((350,420),'测试',(0,255,255),font=font)
    

# PIL图片转cv2
img = cv2.cvtColor(np.array(pil_img), cv2.COLOR_RGB2BGR)
cv2.imwrite('test.jpg',img,[int(cv2.IMWRITE_JPEG_QUALITY),70])

# 显示
cv2.imshow("w_img", img)
# 等待
cv2.waitKey(0)

在这里插入图片描述

图像平滑

在此之前，可能先要了解一下什么是卷积：

https://www.zhihu.com/question/22298352/answer/637156871

https://www.zhihu.com/question/22298352/answer/228543288

用一张图来理解计算过程为：
在这里插入图片描述

均值平滑：

opencv的boxFilter()函数和blur()函数都能用来进行均值平滑，下面演示的原图进行resize后为：

# 原图显示
img1 = cv2.imread('./1080/36.jpg')
img = cv2.resize(img1, (300, 300))
cv2.imshow('img', img)
cv2.waitKey(0)
cv2.destroyAllWindows()

# 均值滤波
# 简单的平均卷积操作
blur = cv2.blur(img, (3, 3))
cv2.imshow('blur', blur)
cv2.waitKey(0)
cv2.destroyAllWindows()

# 方框滤波
# 基本和均值一样，可以选择归一化
box = cv2.boxFilter(img,-1,(3,3), normalize=True)  
cv2.imshow('box', box)
cv2.waitKey(0)
cv2.destroyAllWindows()

# 两张图合并显示
res = np.hstack((img,blur))
#print (res)
cv2.imshow('img vs img_average', res)
cv2.waitKey(0)
cv2.destroyAllWindows()

在这里插入图片描述
经过平均后，我们发现图片肉眼可见变模糊了，下面是关于均值滤波的参数详解：

　　cv2.boxFilter(src,ddepth,ksize,dst,anchor,normalize,borderType)
        src: 输入图像对象矩阵,
        ddepth:数据格式,位深度
        ksize:高斯卷积核的大小，格式为(宽，高)
        dst:输出图像矩阵,大小和数据类型都与src相同
        anchor：卷积核锚点，默认(-1,-1)表示卷积核的中心位置
        normalize:是否归一化 （若卷积核3*5，归一化卷积核需要除以15）
        borderType:填充边界类型
        
    cv2.blur(src,ksize,dst,anchor,borderType)
        src: 输入图像对象矩阵,可以为单通道或多通道
        ksize:高斯卷积核的大小，格式为(宽，高)
        dst:输出图像矩阵,大小和数据类型都与src相同
        anchor：卷积核锚点，默认(-1,-1)表示卷积核的中心位置
        borderType:填充边界类型