Python+Opencv颜色和形状检测

15 篇文章 7 订阅

一、场景需求解读

  现实场景中,我们有时需要自动的检测出图片中目标的颜色和其对应的形状,然后根据这些信息快速的找到我们需要的目标,这在真实场景中具有广泛的应用。下图展示了一张实例,我们需要知道图片中目标的颜色和形状信息。
在这里插入图片描述

二、算法原理简介

  为了检测不同物体的颜色,本文的实现思路为:1)首先定义一个颜色标签类,该类中包含一个颜色字典,包含了需要的所有颜色;2)然后针对每一个轮廓(mask),计算当前lab*颜色值与图像平均值之间的距离;3)最终选择最小距离所代表的颜色值。
  为了检测不同物体的形状,本文的实现思路为:1)首先对输入图片执行预处理;2)然后对预处理之后的图片执行二值化;3)接着进行轮廓检测,并根据顶点的个数进行形状的判断。

三、算法实现步骤

步骤1-读取输入图片;
步骤2-对输入图片执行裁剪操作;
步骤3-执行高斯模糊操作,进行图像去噪;
步骤4-执行图像灰度化操作;
步骤5-执行颜色空间变换,将RGB空间转换为LAB空间;
步骤6-执行二值化操作;
步骤7-遍历每一个轮廓,进行颜色和形状检测;
步骤8-绘制并显示结果。

四、算法代码实现

1、创建一个颜色标签类

# coding=utf-8
# 导入一些python包
from scipy.spatial import distance as dist
from collections import OrderedDict
import numpy as np
import cv2

# 创建一个颜色标签类
class ColorLabeler:
	def __init__(self):
		# 初始化一个颜色词典
		colors = OrderedDict({
			"red": (255, 0, 0),
			"green": (0, 255, 0),
			"blue": (0, 0, 255)})

		# 为LAB图像分配空间
		self.lab = np.zeros((len(colors), 1, 3), dtype="uint8")
		self.colorNames = []

		# 循环 遍历颜色词典
		for (i, (name, rgb)) in enumerate(colors.items()):
			# 进行参数更新
			self.lab[i] = rgb
			self.colorNames.append(name)

		# 进行颜色空间的变换
		self.lab = cv2.cvtColor(self.lab, cv2.COLOR_RGB2LAB)

	def label(self, image, c):
		# 根据轮廓构造一个mask,然后计算mask区域的平均值 
		mask = np.zeros(image.shape[:2], dtype="uint8")
		cv2.drawContours(mask, [c], -1, 255, -1)
		mask = cv2.erode(mask, None, iterations=2)
		mean = cv2.mean(image, mask=mask)[:3]

		# 初始化最小距离
		minDist = (np.inf, None)

		# 遍历已知的LAB颜色值
		for (i, row) in enumerate(self.lab):
			# 计算当前l*a*b*颜色值与图像平均值之间的距离
			d = dist.euclidean(row[0], mean)

			# 如果当前的距离小于最小的距离,则进行变量更新
			if d < minDist[0]:
				minDist = (d, i)

		# 返回最小距离对应的颜色值
		return self.colorNames[minDist[1]]

2、 创建一个形状检测类

# coding=utf-8
import cv2

# 创建形状检测类
class ShapeDetector:
	def __init__(self):
		pass

	def detect(self, c):
		# 初始化形状名和近似的轮廓
		shape = "unidentified"
		peri = cv2.arcLength(c, True)
		approx = cv2.approxPolyDP(c, 0.04 * peri, True)

		# 如果当前的轮廓含有3个顶点,则其为三角形
		if len(approx) == 3:
			shape = "triangle"

		# 如果当前的轮廓含有4个顶点,则其可能是矩形或者正方形
		elif len(approx) == 4:
			# 获取轮廓的边界框并计算长和宽的比例
			(x, y, w, h) = cv2.boundingRect(approx)
			ar = w / float(h)

			shape = "square" if ar >= 0.95 and ar <= 1.05 else "rectangle"

		# 如果这个轮廓含有5个顶点,则它是一个多边形
		elif len(approx) == 5:
			shape = "pentagon"

		# 否则的话,我们认为它是一个圆
		else:
			shape = "circle"

		# 返回形状的名称
		return shape

3、主函数

# coding=utf-8
# python detect_color.py --image example_shapes.png

# 导入一些python包
from shapedetector import ShapeDetector
from colorlabeler import ColorLabeler
import argparse
import imutils
import cv2

# 设置并解析参数
ap = argparse.ArgumentParser()
ap.add_argument("-i", "--image", required=True, help="path to the input image")
args = vars(ap.parse_args())

# 读取图片
image = cv2.imread(args["image"])
# 进行裁剪操作
resized = imutils.resize(image, width=300)
ratio = image.shape[0] / float(resized.shape[0])

# 进行高斯模糊操作
blurred = cv2.GaussianBlur(resized, (5, 5), 0)
# 进行图片灰度化
gray = cv2.cvtColor(blurred, cv2.COLOR_BGR2GRAY)
# 进行颜色空间的变换
lab = cv2.cvtColor(blurred, cv2.COLOR_BGR2LAB)
# 进行阈值分割
thresh = cv2.threshold(gray, 60, 255, cv2.THRESH_BINARY)[1]
cv2.imshow("Thresh", thresh)

# 在二值图片中寻找轮廓
cnts = cv2.findContours(thresh.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
cnts = imutils.grab_contours(cnts)

# 初始化形状检测器和颜色标签
sd = ShapeDetector()
cl = ColorLabeler()

# 遍历每一个轮廓
for c in cnts:
	# 计算每一个轮廓的中心点
	M = cv2.moments(c)
	cX = int((M["m10"] / M["m00"]) * ratio)
	cY = int((M["m01"] / M["m00"]) * ratio)

	# 进行颜色检测和形状检测
	shape = sd.detect(c)
	color = cl.label(lab, c)

	# 进行坐标变换
	c = c.astype("float")
	c *= ratio
	c = c.astype("int")
	text = "{} {}".format(color, shape)
	# 绘制轮廓并显示结果
	cv2.drawContours(image, [c], -1, (0, 255, 0), 2)
	cv2.putText(image, text, (cX, cY), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (255, 255, 255), 2)

	cv2.imshow("Image", image)
	cv2.waitKey(0)

运行方法:python detect_color.py --image example_shapes.png

五、算法效果展示与分析

在这里插入图片描述
  上图展示了该算法的一些中间结果,第1行第1列表示的是裁剪之后的结果,与代码中的resized 对应;第1行第2列表示的是mask图像;第1行第3列表示的是二值化的结果,和代码中的thresh 对应。通过观察上图我们可以发现,该算法可以很好的对输入图片进行二值化,可以准确的检测到不同的轮廓。
在这里插入图片描述
  上图展示了算法的输出结果,通过观察上图我们可以获得一些信息,即该算法可以很好的检测到不同的轮廓,并准确的输出不同轮廓的颜色和形状信息。

参考资料

[1] 参考链接

注意事项

[1] 如果您对AI、自动驾驶、AR、ChatGPT等技术感兴趣,欢迎关注我的微信公众号“AI产品汇”,有问题可以在公众号中私聊我!
[2] 该博客是本人原创博客,如果您对该博客感兴趣,想要转载该博客,请与我联系(qq邮箱:1575262785@qq.com),我会在第一时间回复大家,谢谢大家的关注.
[3] 由于个人能力有限,该博客可能存在很多的问题,希望大家能够提出改进意见。
[4] 如果您在阅读本博客时遇到不理解的地方,希望您可以联系我,我会及时的回复您,和您交流想法和意见,谢谢。
[5] 本文测试的图片可以通过关注微信公众号AI产品汇之后找我索取。
[6] 本人业余时间承接各种本科毕设设计和各种小项目,包括图像处理(数据挖掘、机器学习、深度学习等)、matlab仿真、python算法及仿真等,有需要的请加QQ:1575262785详聊,备注“项目”!!!

  • 53
    点赞
  • 372
    收藏
    觉得还不错? 一键收藏
  • 14
    评论
Python学习笔记》是由皮大庆编写的一本关于Python语言学习的教材。在这本书中,作者详细介绍了Python语言的基础知识、语法规则以及常用的编程技巧。 首先,作者简要介绍了Python语言的特点和优势。他提到,Python是一种易于学习和使用的编程语言,受到了广大程序员的喜爱。Python具有简洁、清晰的语法结构,使得代码可读性极高,同时也提供了丰富的库和模块,能够快速实现各种功能。 接着,作者详细讲解了Python的基本语法。他从变量、数据类型、运算符等基础知识开始,逐步介绍了条件语句、循环控制、函数、模块等高级概念。同时,作者通过大量的示例代码和实践案例,帮助读者加深对Python编程的理解和应用。 在书中,作者还特别强调了编写规范和良好的编程习惯。他从命名规范、注释风格、代码缩进等方面指导读者如何写出清晰、可读性强的Python代码。作者认为,良好的编程习惯对于提高代码质量和提高工作效率非常重要。 此外,作者还介绍了Python的常用库和模块。他提到了一些常用的库,如Numpy、Pandas、Matplotlib等。这些库在数据处理、科学计算、可视化等领域有广泛的应用,帮助读者更好地解决实际问题。 总的来说,《Python学习笔记》是一本非常实用和全面的Python学习教材。通过学习这本书,读者可以系统地学习和掌握Python编程的基础知识和高级应用技巧,为以后的编程学习和工作打下坚实的基础。
评论 14
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值