图像金字塔与轮廓检测

最新推荐文章于 2023-09-16 23:08:33 发布

qq_51478930

最新推荐文章于 2023-09-16 23:08:33 发布

阅读量134

点赞数

分类专栏：笔记文章标签：人工智能计算机视觉

本文链接：https://blog.csdn.net/qq_51478930/article/details/117447246

版权

笔记专栏收录该内容

13 篇文章 0 订阅

订阅专栏

文章目录

一，图像金字塔

高斯金字塔
在这里插入图片描述

import cv2
import matplotlib.pyplot as plt#进行绘图展示
import numpy as np#数值计算工具包
%matplotlib inline
def cv_show(name,img):
    cv2.imshow(name,img)
    cv2.waitKey(0)
    cv2.destroyAllWindows()


img = cv2.read('AM.png')
cv_show(up, 'up')

up = cv2.pyrUp(img) # 补充0变模糊，细节丢失
cv_show(up, 'up')
down = cv2.pyrDown(img) # 细节丢失
cv_show(down, 'down')

二，轮廓检测

cv2.findContours(img,mode,method)
mode:轮廓检索模式

RETR_EXTERNAL ：只检索最外面的轮廓；
RETR_LIST：检索所有的轮廓，并将其保存到一条链表当中；
RETR_CCOMP：检索所有的轮廓，并将他们组织为两层：顶层是各部分的外部边界，第二层是空洞的边界;
RETR_TREE：检索所有的轮廓，并重构嵌套轮廓的整个层次;
method:轮廓逼近方法

CHAIN_APPROX_NONE：以Freeman链码的方式输出轮廓，所有其他方法输出多边形（顶点的序列）。
CHAIN_APPROX_SIMPLE:压缩水平的、垂直的和斜的部分，也就是，函数只保留他们的终点部分。

为了更高的准确率，使用二值图像

# 原图
img = cv2.imread("contours.png")
# 灰度
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 二值化阈值
ret, thresh = cv2.threshold(gray, 127, 255, cv2.THRESH_BINARY)
cv_show("thresh",thresh)
plt.imshow(thresh)
binary, contours, hierarchy = cv2.findContours(thresh, cv2.RETR_TREE, cv2.CHAIN_APPROX_NONE)
# 新版返回参数只有contours, hierarchy
#（括号内）第一个参数：检测所有轮廓。第二个参数：将所有点都画出

轮廓绘制

#传入绘制图像，轮廓，轮廓索引，颜色模式，线条厚度
#注意需要copy,要不然原图会变,会直接将原图改变并保存。
#draw_img = img.copy()
draw_img = img.copy()
res = cv2.drawContours(draw_img, contours, -1, (0, 0, 255), 2)
#宽度是轮廓的大小，适中即可
cv_show(res, 'res')

轮廓特征

cnt = contours[0]  # 第0个轮廓
#面积
cv2.contourArea(cnt)
#周长，True表示闭合的
cv2.arcLength(cnt, True)

轮廓近似
在这里插入图片描述

img = cv2.imread('contours3.png')

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
ret, thresh = cv2.threshold(gray, 127, 255, cv2.THRESH_BINARY)
binary, contours, hierarchy = cv2.findContours(thresh, cv2.RETR_TREE, cv2.CHAIN_APPROX_NONE)
cnt = contours[0]

draw_img = img.copy()
res = cv2.drawContours(draw_img, [cnt], -1, (0, 0, 255), 2)
cv_show(res, 'res')

epsilon = 0.1 * cv2.arcLength(cnt, True)
epsilon = 0.01 * cv2.arcLength(cnt, True) 
# 系数越小，得到的轮廓越细致
approx = cv2.approxPolyDP(cnt, epsilon, True)
draw_img2 = img.copy()
res = cv2.drawContours(draw_img2, [approx], -1, (0, 0, 255), 2)
cv_show(res, 'res')

边界矩形
用处不大

img = cv2.imread('contours2.png')

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
ret, thresh = cv2.threshold(gray, 127, 255, cv2.THRESH_BINARY)
binary, contours, hierarchy = cv2.findContours(thresh, cv2.RETR_TREE, cv2.CHAIN_APPROX_NONE)#轮廓信息
cnt = contours[0]

x, y, w, h = cv2.boundingRect(cnt)
img = cv2.rectangle(img, (x, y), (x+w, y+h), (0, 255, 0), 2)
cv_show(img, 'img')

area = cv2.contourArea(cnt)
x , y, w, h = cv2.boudingRect(cnt)
rect_area = w*h
extent = float(area)/rect_area
print('轮廓面积与边界矩形比'，extent)

外接圆

（x, y）, radius = cv2.minEnclosingCircle(cnt)
center = (int(x), int(y))
radius = int(radius)
img = cv2.circle(img, center, radius, (0, 255, 0), 2)
cv_show(img, 'img')

三，模板匹配

匹配顺序：从左到右，从上到下
模板匹配和卷积原理很像，模板再原图像上从原点开始滑动，计算模板与（图像倍模板覆盖的地方）的差别程度，这个差别程度的计算方法再opencv里有6中，然后将每次计算的结果放入一个矩阵里，作为结果输出。假如原图形是A×B大小，而模板是a×b大小，则输出结果的矩阵是（A-a+1）×（B-b+1)

# 模板匹配
img = cv2.imread('lean.jpg', 0)
template = cv2.imread('face.jpg', 0)
h, w = template.shape(:2)

methods = ['cv2.TM_CCOFFF', 'cv2.TM_CCOEFF_NORMED', 'cv2.TM_CCORR', 'cv2.TM_CCORR_NORMED', 'cv2.TM_SQDIFF', 'cv2.TM_SQDIFF_NORMED', ]

method：
（1）cv2.TM_SQDIFF：计算平方不同，计算出来的值越小，越相关
（2）cv2.TM_CCORR：计算相关性，计算出来的值越大，越相关
（3）cv2.TM_CCOFFF：计算相关系数，计算出来的值越大，越相关
（4）cv2.TM_SQDIFF_NORMED：计算归一化平方不同，计算出来的值越接近0，越相关
（5）cv2.TM_CCORR_NORMED：计算归一化相关性，计算出来的值越接近1，越相关
（6）cv2.TM_CCOEFF_NORMED：计算归一化相关系数，计算出来的值越接近1，越相关

res = cv2.matchTemplate(img, template, cv2.TM_SQDIFF) # cv2.TM_SQDIFF不能写成字符串形式，尽量使用带归一化的操作
#和res = cv2.matchTemplate(img, template, 1)一样

for meth in method:
	img2 = img.copy()

	# 匹配方法的真值
	method = eval(meth) # 执行一个字符串表达式，并返回表达式的值
	print(method)
	res = cv2.matchTemplate(img, teplate, method)
	min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(res)

	# 如果是平方差匹配TM_SQDIFF或归一化平方差匹配TM_SQDIFF_NORMED,取最小值
	if method in [cv2.TM_SQDIFF, cv2.SQDIFF_NORMED]:
		top_left = min_loc
	else:
		top_left = max_loc
	bottom_right = (top_left[0] + w, top_left[1] + h)

	#画矩形
    cv2.rectangle(img2, top_left, bottom_right,255 ,2)
    
    plt.subplot(121),plt.imshow(res,cmap = 'gray')
    plt.xticks([]), plt.yticks([]), #隐藏坐标轴
    plt.subplot(122),plt.imshow(img2,cmap = 'gray')
    plt.xticks([]),plt.yticks([])
    plt.suptitle(meth)
    plt.show()

匹配多个对象
自己选一个合适的范围值与阈值

img_rgb = cv2.imread('mario. jpg')
img_gray = cv2.cvtColor(img_rgb, cv2.COLOR_BGR2GRAY)
template = cv2.imread('mario_coin.jpg', 0)
h, w = template.shape[：2]

res = cv2.matchTemplate(img_gray, template, cv2.TM_CCOEFF_NORMED) # res为匹配系数，越接近1越好。返回的是每个窗口得到的结果值
threshold = 0.8#指定的阈值
# 取匹配程度大于%80的坐标
loc = np.where(res >= threshold)#与阈值进行比较，大于的留下
for pt in zip(*loc[::-1]): # *表示可选参数
	bottom_right = (pt[0] + w, pt[1] + h)
	cv2.rectangle(img_rgb, pt, bottom_right, (0, 0, 255), 2)

cv2.imshow('img_rgb', img_rgb)
cv2.waitKey(0)

四，常用函数

1，cv2.pyrUp(img)
高斯金字塔:向上采样(放大图像)

2，cv2.pyrDown(img)
高斯金字塔:向下采样（缩小图像)

3，img-cv2.pyrUp(cv2.pyrDown(img))
拉普拉斯金字塔(原图-(先缩小后放大))

4，cv2.findContours(img, mode, method)
找出轮廓
img：待测图像

mode：轮廓检索模式

（1）RETR_EXTERNAL：只检索最外面的轮廓；
（2）RETR_LIST：检索所有的轮廓。并将其保存到一条链表当中；
（3）RETR_CCOMP：检索所有的轮廓，并将他们组织为两层；顶层是各部分的外部边界，第二层是空洞的边界；
（4）RETR_TREE：检索所有的轮廓，并重构嵌套轮廓的整个层次；
（最常用的是第四个，默认检测所有，以嵌套保存）
method：轮廓逼近方法
（1）CHAIN_APPROX_NONE：以Freeman链码的方式输出轮廓，所有其他方法输出多边形（顶点的序列）。
（2）CHAIN_APPROX_SIMPLE：压缩水平的、垂直的和斜的部分，也就是，函数只保留他们的终点部分。

5，cv2.drawContours(img, contours, contourIdx, color，width)
画出轮廓
contours：轮廓
contourIdx：轮廓数量，画第几个轮廓；默认-1，即所有轮廓
color：颜色（B,G,R）（0，0，255）则为红色框
width：线条的宽度

6，cv2.contourArea(cnt) 计算轮廓面积

7，cv2.arcLength(cnt, True) 计算轮廓周长，True表示闭合

8，cv2.approxPolyDP(cnt, epsilon, True)
轮廓近似(普朗克算法)
cnt：具体哪个轮廓
epsilon：给字节指定一个值来比较，一般按照周长的百分比设置
True：闭合

9，x, y, w, h = cv2.boundingRect(cnt)
(x, y)为坐标点，w， h为矩形长宽

10，cv2.rectangle(img, pt1, pt2, color,width)
画矩形
pt1：坐标点1
pt2：坐标点2
width：线宽

11，（x, y）, radius = cv2.minEnclosingCircle(cnt) 外接圆近似

12，cv2.circle(img, center, radius,color, width) 画圆

13，res = cv2.matchTemplate(img, template, method)
模板匹配
method：
（1）cv2.TM_SQDIFF：计算平方不同，计算出来的值越小，越相关
（2）cv2.TM_CCORR：计算相关性，计算出来的值越大，越相关
（3）cv2.TM_CCOFFF：计算相关系数，计算出来的值越大，越相关
（4）cv2.TM_SQDIFF_NORMED：计算归一化平方不同，计算出来的值越接近0，越相关
（5）cv2.TM_CCORR_NORMED：计算归一化相关性，计算出来的值越接近1，越相关
（6）cv2.TM_CCOEFF_NORMED：计算归一化相关系数，计算出来的值越接近1，越相关

14，min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(res)
min_val：算法算出的最小值
max_val：算法算出的最大值
min_loc：最小值所在的坐标（因为得到了h，w，所以可得到矩形）
max_loc ：最大值所在的坐标

qq_51478930

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
图像金字塔与轮廓检测

文章目录一，图像金字塔二，轮廓检测三，模板匹配四，常用函数一，图像金字塔高斯金字塔import cv2import matplotlib.pyplot as plt#进行绘图展示import numpy as np#数值计算工具包%matplotlib inlinedef cv_show(name,img): cv2.imshow(name,img) cv2.waitKey(0) cv2.destroyAllWindows()img = cv2.read('A
复制链接

扫一扫