opencv第四天

转换颜色空间

'''目标
在本教程中,您将学习如何将图像从一种颜色空间转换为另一种颜色空间,例如 BGR ↔ Gray、BGR ↔ HSV 等。
除此之外,我们将创建一个应用程序来提取视频中的彩色对象
您将学习以下函数:cv.cvtColor()、cv.inRange() 等。
改变色彩空间
OpenCV 中有超过 150 种颜色空间转换方法可用。 但是我们只研究两个,它们是最广泛使用的:BGR ↔ Gray 和 BGR ↔ HSV。

对于颜色转换,我们使用函数 des=cv.cvtColor(input_image, flag) 其中 flag 确定转换的类型。

对于 BGR → gray转换,我们使用标志 cv.COLOR_BGR2GRAY。 同样对于 BGR → HSV,我们使用标志 cv.COLOR_BGR2HSV。 要获取其他标志,只需在 Python 终端中运行以下命令:'''
import cv2 as cv
flags = [i for i in dir(cv) if i.startswith('COLOR_')]
print( flags )#返回很多的flag值

'''对于 HSV,色调范围为 [0,179],饱和度范围为 [0,255],值范围为 [0,255]。 不同的软件使用不同的尺度。 因此,如果您将 OpenCV 值与它们进行比较,则需要对这些范围进行归一化。'''

'''现在我们知道如何将 BGR 图像转换为 HSV,我们可以使用它来提取彩色对象。 在 HSV 中,表示颜色比在 BGR 颜色空间中更容易。 在我们的应用程序中,我们将尝试提取蓝色对象。 所以这里是方法:

拍摄视频的每一帧
从 BGR 转换为 HSV 颜色空间
我们将 HSV 图像阈值设置为蓝色范围
现在单独提取蓝色对象,我们可以在该图像上做任何我们想做的事情。
下面是详细注释的代码:'''
# 相当于追踪蓝色对象
import numpy as np
cap = cv.VideoCapture(0)
while(1):
    # Take each frame
    _, frame = cap.read()
    # Convert BGR to HSV
    hsv = cv.cvtColor(frame, cv.COLOR_BGR2HSV)
    # define range of blue color in HSV
    lower_blue = np.array([110,50,50])
    upper_blue = np.array([130,255,255])
    # Threshold the HSV image to get only blue colors
    # threshold	 n.	门槛; 门口; 阈; 界; 起始点; 开端; 起点; 入门;
    mask = cv.inRange(hsv, lower_blue, upper_blue)
    # Bitwise-AND mask and original image 按位与
    res = cv.bitwise_and(frame,frame, mask= mask)
    cv.imshow('frame',frame)
    cv.imshow('mask',mask)
    cv.imshow('res',res)
    k = cv.waitKey(5) & 0xFF
    if k == 27:
        break
cv.destroyAllWindows()

'''图像中有一些噪点。 我们将在后面的章节中看到如何删除它。
这是对象跟踪中最简单的方法。 一旦你学会了轮廓的功能,你就可以做很多事情,比如找到物体的质心并用它来跟踪物体,只需在相机前移动你的手就可以绘制图表,以及其他有趣的事情。
如何找到要跟踪的 HSV 值?
这是在 stackoverflow.com 中发现的一个常见问题。 它非常简单,您可以使用相同的函数 cv.cvtColor()。 
您只需传递所需的 BGR 值,而不是传递图像。 例如,要查找 Green 的 HSV 值,请在 Python 终端中尝试以下命令:'''
green = np.uint8([[[0,255,0 ]]])
hsv_green = cv.cvtColor(green,cv.COLOR_BGR2HSV)#此处传递bgr值,而不是图像
print( hsv_green )#[[[ 60 255 255]]]
'''现在您将 [H-10, 100,100] 和 [H+10, 255, 255] 分别作为下限和上限。 除了这种方法,您可以使用任何图像编辑工具
,如 GIMP 或任何在线转换器来查找这些值,但不要忘记调整 HSV 范围。'''

几何变化

1:缩放

'''学习对图像应用不同的几何变换,如平移、旋转、仿射变换等。
您将看到这些函数: cv.getPerspectiveTransform转换
OpenCV 提供了两个转换函数,cv.warpAffine 和 cv.warpPerspective,您可以使用它们执行各种转换。 cv.warpAffine 采用 2x3 变换矩阵,而 cv.warpPerspective 采用 3x3 变换矩阵作为输入。
Scaling:缩放:调整图像的大小。  cv.resize()。 图像的大小可以手动指定,也可以指定缩放因子。 使用了不同的插值方法。
首选的插值方法是用于缩小的 cv.INTER_AREA 和用于缩放的 cv.INTER_CUBIC(慢)和 cv.INTER_LINEAR。
默认情况下,插值方法 cv.INTER_LINEAR 用于所有调整大小的目的。 您可以使用以下任一方法调整输入图像的大小:'''

import numpy as np
import cv2 as cv
from matplotlib import pyplot as plt

img = cv.imread('1.jpg')
cv.imshow("img",img)
cv.waitKey(0)
cv.destroyAllWindows()
# cubicadj.	立方体的; 立方的; 用立方单位度量(或表示)的; 立方形的;
# n.	三次曲线; 三次方程式; 三次多项式; 三次函数;
res = cv.resize(img,None,fx=2, fy=2, interpolation = cv.INTER_CUBIC)#使用缩放因子
cv.imshow("img",res)
cv.waitKey(0)
cv.destroyAllWindows()
#OR
height, width = img.shape[:2]#因为图像的shape=(高,宽,通道数)  【:2】表示取0和1即高宽
res = cv.resize(img,(2*width, 2*height), interpolation = cv.INTER_CUBIC)#设定指定高度
cv.imshow("img",res)
cv.waitKey(0)
cv.destroyAllWindows()

 

 2.平移

'''平移是物体位置的移动。如果您知道在(x,y)方向上的位移,则将其设为(tx,ty),你可以创建转换矩阵
M,如下所示:
        M= 1 0 tx
           0 1 ty   这样一个2*3的矩阵

您可以将其放入**np.float32**类型的Numpy数组中,并将其传递给**cv.warpAffine**函数。参见下面偏移为(100, 50)的示例:'''

img = cv.imread('1.jpg',0)
'''使用函数cv2.imread(filepath,flags)读入一副图片
filepath:要读入图片的完整路径
flags:读入图片的标志
    cv2.IMREAD_COLOR:默认参数,读入一副彩色图片,忽略alpha通道,可以直接写1(shape输出为三维)
    cv2.IMREAD_GRAYSCALE:读入灰度图片,可以直接写0  (shape输出为2维)
    cv2.IMREAD_UNCHANGED:顾名思义,读入完整图片,包括alpha通道,可以直接写-1(shape输出为三维,不过第三维多一维即多出alpha通道)

    一般常用1或0,即彩色图片或灰度图片
'''
rows,cols = img.shape
M = np.float32([[1,0,100],[0,1,50]])
dst = cv.warpAffine(img,M,(cols,rows))#warpAffine包裹仿射
#cv.warpAffine函数的第三个参数是输出图像的大小,其形式应为(width,height)。记住width =列数,height =行数。
cv.imshow('img',dst)
cv.waitKey(0)
cv.destroyAllWindows()

 

3,旋转 

img = cv.imread('1.jpg',0)
rows,cols = img.shape

'''cv2.getRotationMatrix2D()就是方便我们进行上述矩阵的获取。
其经常被使用到的参数有三个:
    旋转中心
    旋转角度
    旋转后的缩放比例'''
# cols-1 和 rows-1 是坐标限制
M = cv.getRotationMatrix2D(((cols-1)/2.0,(rows-1)/2.0),90,1)#绕中心逆时针旋转90度,并且缩放1(即保持原来大小)的矩阵
dst = cv.warpAffine(img,M,(cols,rows))
cv.imshow('img',dst)
cv.waitKey(0)
cv.destroyAllWindows()

5.仿射变化(灵活角度变化)

'''在仿射变换中,原始图像中的所有平行线在输出图像中仍将平行。为了找到变换矩阵,
我们需要输入图像中的三个点及其在输出图像中的对应位置。然后**cv.getAffineTransform**将创建一个2x3矩阵,
该矩阵将传递给**cv.warpAffine**。

'''
img = cv.imread('1.png')
rows,cols,ch = img.shape#也可以直接row,cols=img.shape[:2]
pts1 = np.float32([[25,25],[100,25],[25,100]])#原始图像中的三个点(为什么是三个点呢?因为三个点确定一个平面)
pts2 = np.float32([[5,50],[100,25],[50,125]])#希望变化后到达的三个点
M = cv.getAffineTransform(pts1,pts2)
dst = cv.warpAffine(img,M,(cols,rows))
plt.subplot(121),plt.imshow(img),plt.title('Input')
plt.subplot(122),plt.imshow(dst),plt.title('Output')
plt.show()

 

官方展示:

6.透视变化

'''对于透视变换,您需要3x3变换矩阵。即使在转换后,直线也将保持直线。
要找到此变换矩阵,您需要在输入图像上有4个点,在输出图像上需要相应的点。在这四个点中,其中三个不应共线。然后可以通过函数**cv.getPerspectiveTransform**找到变换矩阵。
然后将**cv.warpPerspective**应用于此3x3转换矩阵。'''
img = cv.imread('1.png')
rows,cols,ch = img.shape
pts1 = np.float32([[28,32.5],[184,26],[14,195],[194,170]])
pts2 = np.float32([[0,0],[200,0],[0,200],[200,200]])
M = cv.getPerspectiveTransform(pts1,pts2)
dst = cv.warpPerspective(img,M,(200,200))
plt.subplot(121),plt.imshow(img),plt.title('Input')
plt.subplot(122),plt.imshow(dst),plt.title('Output')
plt.show()

 

官方的图片展示可能更清楚

阈值

'''threshold是“阈值”、“临界值”、“门槛”的意思。
参数:
    第一个:老规律了,首先就是你搞搞事情的对象,你要搞谁,搞哪张图片。
    第二个:阈值,threshold,告诉函数门槛是什么。
    第三个:最大值,有可能会用到的值,取决于你后面选取的type,maxval = max value。
    第四个:type,怎么搞事情,搞事情的方法。
我学到的type有一下几种,现在新版本有很多了。

'''
import cv2 as cv
import numpy as np
from matplotlib import pyplot as plt
img = cv.imread('gradient.png',0)
'''1 cv.THRESH_BINARY 首先解释一下这个参数的英文含义,这是理解的第一步。
THRESH 其实就是:threshold 也就是门槛的意思,代表cv.threshold()这个函数,然后BINARY 是binary 是二进制、二的意思,意在告诉我们结果只有两个。
用代码说的话就是:destination = (src[i,j]>threshold)? maxval : 0;
也就是:灰度图的在[i,j]位置的像素值是否大于阈值,如果大于的话,那么它的值就是maxval,如果不是的话(哪怕是等于也不行),那么就等于0。
通俗的来说就是:threshold就像是一个正直的巡逻官,他在每个灰度图的像素点去巡视(遍历),如果发现有比他小的像素,就直接把这个没用的像素给判死刑,置为0,如果发现比他还要高,还要牛逼的像素点,那么就直接把这个大哥给升到他所能升到的最高值maxval。'''
ret,thresh1 = cv.threshold(img,127,255,cv.THRESH_BINARY)

'''2 cv.THRESH_BINARY_INV 还是解释一下,前面的就不解释了,后面的INV 其实就是invert,是反的意思,也就是说和第一个方法恰恰相反。
用代码解释的话就是:destination = (src[i,j] >threshold)? 0:maxval;
就是说,灰度图图的[i,j]位置的像素点的像素值是否大于阈值,如果大于的话,那么就变成0,否则变成最大值。
'''
ret,thresh2 = cv.threshold(img,127,255,cv.THRESH_BINARY_INV)

'''3 cv.THRESH_TRUNC,“TRUNC” 可以通过百度查到,是“truncate” ,截断的意思。
用代码理解就是:destination = (src[i,j] >threshold)? maxval : src[i,j]
这个意思恰好解释了其原理的一部分。其原理就是:遍历每一个灰度图的像素,如果遍历到的像素值大于这个阈值,那么就把这个像素值变成你预先输入的maxval,
在这里maxval可以理解成一个像素值可以达到的最大值,如果小于等于,那么就保持不变。
'''
ret,thresh3 = cv.threshold(img,127,255,cv.THRESH_TRUNC)

'''4 cv.THRESH_TOZERO
“TOZERO” 可以看成 “to zero" 可以理解成:变成0的意思。
用代码理解:destination = (src[i,j] >threshold)? src[i,j] : 0;
也就是,遍历灰度图的每一个像素点,如果遍历到的像素值大于这个阈值,那么保持不变,如果小于等于这个阈值,那么不好意思,直接为0。
'''
ret,thresh4 = cv.threshold(img,127,255,cv.THRESH_TOZERO)

'''5 cv.THRESH_TOZERO_INV
”TOZERO_INV" 可以理解为:“to zero invert" 也就是,变成零的反义词,和上一个操作完全相反。
用代码理解:destination = (src[i,j] > threshold)? 0:src[i,j]
也就是:遍历灰度图的每个一像素点,如果遍历到的像素点的像素值大于这个阈值,那么直接为0,否则,如果小于等于这个阈值,那么就保持不变。'''

ret,thresh5 = cv.threshold(img,127,255,cv.THRESH_TOZERO_INV)
titles = ['Original Image','BINARY','BINARY_INV','TRUNC','TOZERO','TOZERO_INV']
images = [img, thresh1, thresh2, thresh3, thresh4, thresh5]
for i in range(6):
    plt.subplot(2,3,i+1),plt.imshow(images[i],'gray')
    plt.title(titles[i])
    plt.xticks([]),plt.yticks([])
plt.show()

自适应阈值
在上一节中,我们使用一个全局值作为阈值。但这可能并非在所有情况下都很好,例如,如果图像在不同区域具有不同的光照条件。在这种情况下,自适应阈值阈值化可以提供帮助。在此,算法基于像素周围的小区域确定像素的阈值。因此,对于同一图像的不同区域,我们获得了不同的阈值,这为光照度变化的图像提供了更好的结果。
第一个参数表示原图像(灰度图像,8bit单通道)
第二个参数官方的解释是最大值,但是根据我的实现来看,只要不为0,不影响最后结果。
第三个参数表示阈值的计算方式:
    cv2.ADPTIVE_THRESH_MEAN_C:阈值取自相邻区域的平均值
    cv2.ADPTIVE_THRESH_GAUSSIAN_C:阈值取值相邻区域的加权和,权重为一个高斯窗口
第四个参数表示阈值类型,参照简单阈值中的解释。
第五个参数表示邻域大小,即计算阈值的区域大小,一般是3,5,7,....
第六个参数表示常数,计算出阈值之后,要减去这个参数,才是最后的阈值。

 

import cv2 as cv
import numpy as np
from matplotlib import pyplot as plt
img = cv.imread('sudoku.png',0)
img = cv.medianBlur(img,5)
ret,th1 = cv.threshold(img,127,255,cv.THRESH_BINARY)#全局阈值
'''下面的这个 \ 也可以不要 仅用于换行,不要也可以'''
th2 = cv.adaptiveThreshold(img,255,cv.ADAPTIVE_THRESH_MEAN_C,\
                           cv.THRESH_BINARY,11,2)#平均阈值,领域大小为11,常数为2
th3 = cv.adaptiveThreshold(img,255,cv.ADAPTIVE_THRESH_GAUSSIAN_C,\
            cv.THRESH_BINARY,11,2)#高斯阈值
titles = ['Original Image', 'Global Thresholding (v = 127)',
            'Adaptive Mean Thresholding', 'Adaptive Gaussian Thresholding']
images = [img, th1, th2, th3]
for i in range(4):
    plt.subplot(2,2,i+1),plt.imshow(images[i],'gray')
    plt.title(titles[i])
    plt.xticks([]),plt.yticks([])
    '''设置x或y轴对应显示的标签:xticks(ticks=None, labels=None, **kwargs)

ticks : array_like,应当放置刻度的位置列表,可以传递一个空列表来禁用xticks
labels :array_like, 放置在给定* locs *处的显式标签的列表。
**kwargs:Text属性可以用来控制标签的外观。
'''
plt.show()

Otsu的二值化

在全局阈值化中,我们使用任意选择的值作为阈值。相反,Otsu的方法避免了必须选择一个值并自动确定它的情况。

考虑仅具有两个不同图像值的图像(双峰图像),其中直方图将仅包含两个峰。一个好的阈值应该在这两个值的中间。类似地,Otsu的方法从图像直方图中确定最佳全局阈值。

为此,使用了**cv.threshold**作为附加标志传递。阈值可以任意选择。然后,算法找到最佳阈值,该阈值作为第一输出返回。

查看以下示例。输入图像为噪点图像。在第一种情况下,采用值为127的全局阈值。在第二种情况下,直接采用Otsu阈值法。在第三种情况下,首先使用5x5高斯核对图像进行滤波以去除噪声,然后应用Otsu阈值处理。了解噪声滤波如何改善结果

import cv2 as cv
import numpy as np
from matplotlib import pyplot as plt
img = cv.imread('noisy2.png',0)
# 全局阈值
ret1,th1 = cv.threshold(img,127,255,cv.THRESH_BINARY)
# Otsu阈值
ret2,th2 = cv.threshold(img,0,255,cv.THRESH_BINARY+cv.THRESH_OTSU)
# 高斯滤波后再采用Otsu阈值
blur = cv.GaussianBlur(img,(5,5),0)
ret3,th3 = cv.threshold(blur,0,255,cv.THRESH_BINARY+cv.THRESH_OTSU)
# 绘制所有图像及其直方图
images = [img, 0, th1,
          img, 0, th2,
          blur, 0, th3]
titles = ['Original Noisy Image','Histogram','Global Thresholding (v=127)',
          'Original Noisy Image','Histogram',"Otsu's Thresholding",
          'Gaussian filtered Image','Histogram',"Otsu's Thresholding"]
for i in range(3):
    plt.subplot(3,3,i*3+1),plt.imshow(images[i*3],'gray')
    plt.title(titles[i*3]), plt.xticks([]), plt.yticks([])
    plt.subplot(3,3,i*3+2),plt.hist(images[i*3].ravel(),256)#256个小隔间
    # plt.hist 将一个大区间划分为等间隔的小区间,并统计每个区间上样本出现的频数之和
    # ravel() 将数组维度拉至一维数组
    plt.title(titles[i*3+1]), plt.xticks([]), plt.yticks([])
    plt.subplot(3,3,i*3+3),plt.imshow(images[i*3+2],'gray')
    plt.title(titles[i*3+2]), plt.xticks([]), plt.yticks([])
plt.show()

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值