一,图像金字塔
高斯金字塔
import cv2
import matplotlib.pyplot as plt#进行绘图展示
import numpy as np#数值计算工具包
%matplotlib inline
def cv_show(name,img):
cv2.imshow(name,img)
cv2.waitKey(0)
cv2.destroyAllWindows()
img = cv2.read('AM.png')
cv_show(up, 'up')
up = cv2.pyrUp(img) # 补充0变模糊,细节丢失
cv_show(up, 'up')
down = cv2.pyrDown(img) # 细节丢失
cv_show(down, 'down')
二,轮廓检测
cv2.findContours(img,mode,method)
mode:轮廓检索模式
RETR_EXTERNAL :只检索最外面的轮廓;
RETR_LIST:检索所有的轮廓,并将其保存到一条链表当中;
RETR_CCOMP:检索所有的轮廓,并将他们组织为两层:顶层是各部分的外部边界,第二层是空洞的边界;
RETR_TREE:检索所有的轮廓,并重构嵌套轮廓的整个层次;
method:轮廓逼近方法
CHAIN_APPROX_NONE:以Freeman链码的方式输出轮廓,所有其他方法输出多边形(顶点的序列)。
CHAIN_APPROX_SIMPLE:压缩水平的、垂直的和斜的部分,也就是,函数只保留他们的终点部分。
为了更高的准确率,使用二值图像
# 原图
img = cv2.imread("contours.png")
# 灰度
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 二值化阈值
ret, thresh = cv2.threshold(gray, 127, 255, cv2.THRESH_BINARY)
cv_show("thresh",thresh)
plt.imshow(thresh)
binary, contours, hierarchy = cv2.findContours(thresh, cv2.RETR_TREE, cv2.CHAIN_APPROX_NONE)
# 新版返回参数只有contours, hierarchy
#(括号内)第一个参数:检测所有轮廓。第二个参数:将所有点都画出
轮廓绘制
#传入绘制图像,轮廓,轮廓索引,颜色模式,线条厚度
#注意需要copy,要不然原图会变,会直接将原图改变并保存。
#draw_img = img.copy()
draw_img = img.copy()
res = cv2.drawContours(draw_img, contours, -1, (0, 0, 255), 2)
#宽度是轮廓的大小,适中即可
cv_show(res, 'res')
轮廓特征
cnt = contours[0] # 第0个轮廓
#面积
cv2.contourArea(cnt)
#周长,True表示闭合的
cv2.arcLength(cnt, True)
轮廓近似
img = cv2.imread('contours3.png')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
ret, thresh = cv2.threshold(gray, 127, 255, cv2.THRESH_BINARY)
binary, contours, hierarchy = cv2.findContours(thresh, cv2.RETR_TREE, cv2.CHAIN_APPROX_NONE)
cnt = contours[0]
draw_img = img.copy()
res = cv2.drawContours(draw_img, [cnt], -1, (0, 0, 255), 2)
cv_show(res, 'res')
epsilon = 0.1 * cv2.arcLength(cnt, True)
epsilon = 0.01 * cv2.arcLength(cnt, True)
# 系数越小,得到的轮廓越细致
approx = cv2.approxPolyDP(cnt, epsilon, True)
draw_img2 = img.copy()
res = cv2.drawContours(draw_img2, [approx], -1, (0, 0, 255), 2)
cv_show(res, 'res')
边界矩形
用处不大
img = cv2.imread('contours2.png')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
ret, thresh = cv2.threshold(gray, 127, 255, cv2.THRESH_BINARY)
binary, contours, hierarchy = cv2.findContours(thresh, cv2.RETR_TREE, cv2.CHAIN_APPROX_NONE)#轮廓信息
cnt = contours[0]
x, y, w, h = cv2.boundingRect(cnt)
img = cv2.rectangle(img, (x, y), (x+w, y+h), (0, 255, 0), 2)
cv_show(img, 'img')
area = cv2.contourArea(cnt)
x , y, w, h = cv2.boudingRect(cnt)
rect_area = w*h
extent = float(area)/rect_area
print('轮廓面积与边界矩形比',extent)
外接圆
(x, y), radius = cv2.minEnclosingCircle(cnt)
center = (int(x), int(y))
radius = int(radius)
img = cv2.circle(img, center, radius, (0, 255, 0), 2)
cv_show(img, 'img')
三,模板匹配
匹配顺序:从左到右,从上到下
模板匹配和卷积原理很像,模板再原图像上从原点开始滑动,计算模板与(图像倍模板覆盖的地方)的差别程度,这个差别程度的计算方法再opencv里有6中,然后将每次计算的结果放入一个矩阵里,作为结果输出。假如原图形是A×B大小,而模板是a×b大小,则输出结果的矩阵是(A-a+1)×(B-b+1)
# 模板匹配
img = cv2.imread('lean.jpg', 0)
template = cv2.imread('face.jpg', 0)
h, w = template.shape(:2)
methods = ['cv2.TM_CCOFFF', 'cv2.TM_CCOEFF_NORMED', 'cv2.TM_CCORR', 'cv2.TM_CCORR_NORMED', 'cv2.TM_SQDIFF', 'cv2.TM_SQDIFF_NORMED', ]
method:
(1)cv2.TM_SQDIFF:计算平方不同,计算出来的值越小,越相关
(2)cv2.TM_CCORR:计算相关性,计算出来的值越大,越相关
(3)cv2.TM_CCOFFF:计算相关系数,计算出来的值越大,越相关
(4)cv2.TM_SQDIFF_NORMED:计算归一化平方不同,计算出来的值越接近0,越相关
(5)cv2.TM_CCORR_NORMED:计算归一化相关性,计算出来的值越接近1,越相关
(6)cv2.TM_CCOEFF_NORMED:计算归一化相关系数,计算出来的值越接近1,越相关
res = cv2.matchTemplate(img, template, cv2.TM_SQDIFF) # cv2.TM_SQDIFF不能写成字符串形式,尽量使用带归一化的操作
#和res = cv2.matchTemplate(img, template, 1)一样
for meth in method:
img2 = img.copy()
# 匹配方法的真值
method = eval(meth) # 执行一个字符串表达式,并返回表达式的值
print(method)
res = cv2.matchTemplate(img, teplate, method)
min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(res)
# 如果是平方差匹配TM_SQDIFF或归一化平方差匹配TM_SQDIFF_NORMED,取最小值
if method in [cv2.TM_SQDIFF, cv2.SQDIFF_NORMED]:
top_left = min_loc
else:
top_left = max_loc
bottom_right = (top_left[0] + w, top_left[1] + h)
#画矩形
cv2.rectangle(img2, top_left, bottom_right,255 ,2)
plt.subplot(121),plt.imshow(res,cmap = 'gray')
plt.xticks([]), plt.yticks([]), #隐藏坐标轴
plt.subplot(122),plt.imshow(img2,cmap = 'gray')
plt.xticks([]),plt.yticks([])
plt.suptitle(meth)
plt.show()
匹配多个对象
自己选一个合适的范围值与阈值
img_rgb = cv2.imread('mario. jpg')
img_gray = cv2.cvtColor(img_rgb, cv2.COLOR_BGR2GRAY)
template = cv2.imread('mario_coin.jpg', 0)
h, w = template.shape[:2]
res = cv2.matchTemplate(img_gray, template, cv2.TM_CCOEFF_NORMED) # res为匹配系数,越接近1越好。返回的是每个窗口得到的结果值
threshold = 0.8#指定的阈值
# 取匹配程度大于%80的坐标
loc = np.where(res >= threshold)#与阈值进行比较,大于的留下
for pt in zip(*loc[::-1]): # *表示可选参数
bottom_right = (pt[0] + w, pt[1] + h)
cv2.rectangle(img_rgb, pt, bottom_right, (0, 0, 255), 2)
cv2.imshow('img_rgb', img_rgb)
cv2.waitKey(0)
四,常用函数
1,cv2.pyrUp(img)
高斯金字塔:向上采样(放大图像)
2,cv2.pyrDown(img)
高斯金字塔:向下采样(缩小图像)
3,img-cv2.pyrUp(cv2.pyrDown(img))
拉普拉斯金字塔(原图-(先缩小后放大))
4,cv2.findContours(img, mode, method)
找出轮廓
img:待测图像
mode:轮廓检索模式
(1)RETR_EXTERNAL:只检索最外面的轮廓;
(2)RETR_LIST:检索所有的轮廓。并将其保存到一条链表当中;
(3)RETR_CCOMP:检索所有的轮廓,并将他们组织为两层;顶层是各部分的外部边界,第二层是空洞的边界;
(4)RETR_TREE:检索所有的轮廓,并重构嵌套轮廓的整个层次;
(最常用的是第四个,默认检测所有,以嵌套保存)
method:轮廓逼近方法
(1)CHAIN_APPROX_NONE:以Freeman链码的方式输出轮廓,所有其他方法输出多边形(顶点的序列)。
(2)CHAIN_APPROX_SIMPLE:压缩水平的、垂直的和斜的部分,也就是,函数只保留他们的终点部分。
5,cv2.drawContours(img, contours, contourIdx, color,width)
画出轮廓
contours:轮廓
contourIdx:轮廓数量,画第几个轮廓;默认-1,即所有轮廓
color:颜色(B,G,R)(0,0,255)则为红色框
width:线条的宽度
6,cv2.contourArea(cnt) 计算轮廓面积
7,cv2.arcLength(cnt, True) 计算轮廓周长,True表示闭合
8,cv2.approxPolyDP(cnt, epsilon, True)
轮廓近似(普朗克算法)
cnt:具体哪个轮廓
epsilon:给字节指定一个值来比较,一般按照周长的百分比设置
True:闭合
9,x, y, w, h = cv2.boundingRect(cnt)
(x, y)为坐标点,w, h为矩形长宽
10,cv2.rectangle(img, pt1, pt2, color,width)
画矩形
pt1:坐标点1
pt2:坐标点2
width:线宽
11,(x, y), radius = cv2.minEnclosingCircle(cnt) 外接圆近似
12,cv2.circle(img, center, radius,color, width) 画圆
13,res = cv2.matchTemplate(img, template, method)
模板匹配
method:
(1)cv2.TM_SQDIFF:计算平方不同,计算出来的值越小,越相关
(2)cv2.TM_CCORR:计算相关性,计算出来的值越大,越相关
(3)cv2.TM_CCOFFF:计算相关系数,计算出来的值越大,越相关
(4)cv2.TM_SQDIFF_NORMED:计算归一化平方不同,计算出来的值越接近0,越相关
(5)cv2.TM_CCORR_NORMED:计算归一化相关性,计算出来的值越接近1,越相关
(6)cv2.TM_CCOEFF_NORMED:计算归一化相关系数,计算出来的值越接近1,越相关
14,min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(res)
min_val:算法算出的最小值
max_val:算法算出的最大值
min_loc:最小值所在的坐标(因为得到了h,w,所以可得到矩形)
max_loc :最大值所在的坐标