python图像处理opencv笔记(三):图像处理

引言

本篇主要想总结一下关于图像相关方面第三个知识点,为图像的一些基本处理。

图像处理

灰度图与阈值

import cv2 #opencv读取的格式是BGR
import numpy as np
import matplotlib.pyplot as plt#Matplotlib是RGB
%matplotlib inline 

img=cv2.imread(r'./1200/picture4.jpg')
img_gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
img_gray.shape	
"""
(1200, 1920)
"""

hsv=cv2.cvtColor(img,cv2.COLOR_BGR2HSV)
cv2.imshow("hsv", hsv)
cv2.waitKey(0)    
cv2.destroyAllWindows()

其中HSV(Hue, Saturation, Value)是根据颜色的直观特性由A. R. Smith在1978年创建的一种颜色空间, 也称六角锥体模型(Hexcone Model)。这个模型中颜色的参数分别是:色调(H),饱和度(S),明度(V)。


图像阈值

ret, dst = cv2.threshold(src, thresh, maxval, type)

  • src: 输入图,只能输入单通道图像,通常来说为灰度图

  • dst: 输出图

  • thresh: 阈值

  • maxval: 当像素值超过了阈值(或者小于阈值,根据type来决定),所赋予的值

  • type:二值化操作的类型,包含以下5种类型: cv2.THRESH_BINARY; cv2.THRESH_BINARY_INV; cv2.THRESH_TRUNC; cv2.THRESH_TOZERO;cv2.THRESH_TOZERO_INV

  • cv2.THRESH_BINARY 超过阈值部分取maxval(最大值),否则取0

  • cv2.THRESH_BINARY_INV THRESH_BINARY的反转

  • cv2.THRESH_TRUNC 大于阈值部分设为阈值,否则不变

  • cv2.THRESH_TOZERO 大于阈值部分不改变,否则设为0

  • cv2.THRESH_TOZERO_INV THRESH_TOZERO的反转

可以测试,代码为:

ret, thresh1 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_BINARY)
ret, thresh2 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_BINARY_INV)
ret, thresh3 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_TRUNC)
ret, thresh4 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_TOZERO)
ret, thresh5 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_TOZERO_INV)

titles = ['Original Image', 'BINARY', 'BINARY_INV', 'TRUNC', 'TOZERO', 'TOZERO_INV']
images = [img, thresh1, thresh2, thresh3, thresh4, thresh5]

for i in range(6):
    plt.subplot(2, 3, i + 1), plt.imshow(images[i], 'gray')
    plt.title(titles[i])
    plt.xticks([]), plt.yticks([])
plt.savefig('test.jpg')
plt.show()

在这里插入图片描述

图像标注

import cv2
import numpy
 
cv2.namedWindow("Image") #创建窗口
 
img = cv2.imread(r'./1200/picture4.jpg') #读取图像
 
cv2.line(img,(50,50),(300,300),(255,0,0),2) #画直线
 
cv2.rectangle(img,(500,20),(580,100),(0,255,0),-1)  #画矩形
 
cv2.circle(img,(500,300),40,(255,255,0),-1) #画圆形
 
pts = numpy.array([[300,300],[300,340],[350,320]],numpy.int32)  #用numpy形成坐标列表
cv2.polylines(img,[pts],True,(0,255,255),2)  #画多边形
font = ImageFont.truetype('simhei.ttf',30,encoding='utf-8')

cv2.putText(img,'测试',(350,420),cv2.FONT_HERSHEY_SIMPLEX,1,(255,232,133),2)

cv2.imshow('Image',img)
cv2.imwrite('test.jpg',img,[int(cv2.IMWRITE_JPEG_QUALITY),70])
cv2.waitKey(0)
cv2.destroyWindow("Image")  #关闭窗口

在这里插入图片描述

opencv 提供了绘制直线、圆形、矩形等基本绘图的功能

  1. 绘直线
    cv2.line(画布,起点坐标,终点坐标,颜色,宽度)

    例如:
    cv2.line(image,(20,60),(300,400),(0,0,255),2)

  2. 绘矩形
    cv2.rectange(画布,起点,终点,颜色,宽度)

    若宽度大于0,标识边线宽度;如果小于0,表示画实心矩形
    cv2.rectange(image,(20,60),(300,400),(255,0,0),-1)

  3. 绘圆形
    cv2.circle(画布,圆心坐标,半径,颜色,宽度)

    若宽度大于0,标识边线宽度;如果小于0,表示画实心圆行
    cv2.circle(image,(300,300),40,(0,255,0),2)

  4. 绘多边形
    cv2.polylines(画布,点坐标列表,封闭,颜色,宽度)

    点坐标列表是一个numpy类型的列表,需要导入numpy 包

import numpy
pts = numpy.array([[20,60],[300,280],[150,200]],numpy.int32)	# 创建点坐标
cv2.rectange(image,[pts],True,(0,0,255),2)
  1. 添加文字
    cv2.putText(画布,文字,位置,字体,大小,颜色,文字粗细)
  • cv2.FONT_HERSHEY_SIMPLEX 正常尺寸的sans-serif字体

  • cv2.FONT_HERSHEY_SPLAIN 小尺寸的sans-serif字体

  • cv2.FONT_HERSHEY_COMPLEX 正常尺寸的serif字体

  • cv2.FONT_HERSHEY_SCREIPT_SIMPLEX 手写字体风格

这里有一个问题是中文出现了乱码,左边小姐姐头上出现了 ? 号,要解决这个问题可以使用 freetype 模块,在python3已经提供了pip的安装方式,但我看网上资料很少,大部分还是选择用pillow,那么代码如下:

from PIL import Image,ImageDraw,ImageFont
import cv2
import numpy as np
# 读取文件
#pil_img = Image.open('1.jpg',)
# 读取cv2文件
pil_img = Image.fromarray(cv2.cvtColor(img, cv2.COLOR_BGR2RGB))
# pil_img.show()
# 生成画笔
draw = ImageDraw.Draw(pil_img)
# 第一个参数是字体文件的路径,第二个是字体大小
font = ImageFont.truetype('simhei.ttf',60,encoding='utf-8')
# 第一个参数是文字的起始坐标,第二个需要输出的文字,第三个是字体颜色,第四个是字体类型
draw.text((350,420),'测试',(0,255,255),font=font)
    

# PIL图片转cv2
img = cv2.cvtColor(np.array(pil_img), cv2.COLOR_RGB2BGR)
cv2.imwrite('test.jpg',img,[int(cv2.IMWRITE_JPEG_QUALITY),70])

# 显示
cv2.imshow("w_img", img)
# 等待
cv2.waitKey(0)

在这里插入图片描述


图像平滑

在此之前,可能先要了解一下什么是卷积:


https://www.zhihu.com/question/22298352/answer/637156871

https://www.zhihu.com/question/22298352/answer/228543288

用一张图来理解计算过程为:
在这里插入图片描述

均值平滑:

opencv的boxFilter()函数和blur()函数都能用来进行均值平滑,下面演示的原图进行resize后为:

# 原图显示
img1 = cv2.imread('./1080/36.jpg')
img = cv2.resize(img1, (300, 300))
cv2.imshow('img', img)
cv2.waitKey(0)
cv2.destroyAllWindows()

# 均值滤波
# 简单的平均卷积操作
blur = cv2.blur(img, (3, 3))
cv2.imshow('blur', blur)
cv2.waitKey(0)
cv2.destroyAllWindows()

# 方框滤波
# 基本和均值一样,可以选择归一化
box = cv2.boxFilter(img,-1,(3,3), normalize=True)  
cv2.imshow('box', box)
cv2.waitKey(0)
cv2.destroyAllWindows()

# 两张图合并显示
res = np.hstack((img,blur))
#print (res)
cv2.imshow('img vs img_average', res)
cv2.waitKey(0)
cv2.destroyAllWindows()

在这里插入图片描述
经过平均后,我们发现图片肉眼可见变模糊了,下面是关于均值滤波的参数详解:

  cv2.boxFilter(src,ddepth,ksize,dst,anchor,normalize,borderType)
        src: 输入图像对象矩阵,
        ddepth:数据格式,位深度
        ksize:高斯卷积核的大小,格式为(宽,高)
        dst:输出图像矩阵,大小和数据类型都与src相同
        anchor:卷积核锚点,默认(-1,-1)表示卷积核的中心位置
        normalize:是否归一化 (若卷积核3*5,归一化卷积核需要除以15)
        borderType:填充边界类型
        
    cv2.blur(src,ksize,dst,anchor,borderType)
        src: 输入图像对象矩阵,可以为单通道或多通道
        ksize:高斯卷积核的大小,格式为(宽,高)
        dst:输出图像矩阵,大小和数据类型都与src相同
        anchor:卷积核锚点,默认(-1,-1)表示卷积核的中心位置
        borderType:填充边界类型

高斯滤波

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

submarineas

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值