Python使用opencv识别简单图片中的主颜色

这篇博客介绍了一种使用Python和opencv从屏幕截图中识别橘色高亮文字的方法。通过二值化、腐蚀处理、垂直投影等步骤分割图片,再利用HSV模型识别颜色,从而实现对特定颜色区域的定位和提取。
摘要由CSDN通过智能技术生成

一、业务需求

本人也是python的初学者,在工作中接触一些简单的人工智能。因为工作关系,需要从系统提供的屏幕截图中识别系统菜单中的文字,该文字有一明显特征,就是橘色的高亮文字。那么需求就是从一个图片文件中识别里面的橘色高亮文字。识别图片样例:
在这里插入图片描述

二、设计思路

对样例图片进行分析,发现图片比较简单,没有太多颜色混杂在一起,主要是黑色字体、高亮的橘色字体这2两种字体组成。这样就给解决方案带来了很多便利性,设计思路大概如需:

  1. 分割图片:找到样例图片中的字块,进行分割,获取图片字块的像素坐标;
  2. 获取图片字块中的颜色:对图片字块中的颜色进行识别,找出属于橘色系的颜色部分,如果颜色区域的面积大于一个预设的阈值,就可以判断该图块的字体颜色符合预期。

三、分割图片

1、使用opencv,将图片转换为二值图,方便进行下面的处理

import cv2
import numpy as np
import matplotlib.pyplot as plt

image = cv2.imread('x4.jpg')

gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)  # 转换了灰度化
ret, img = cv2.threshold(gray, 160, 255, cv2.THRESH_BINARY)  # 将灰度图像二值化
img = 255 - img
cv2.imshow("img", img)
cv2.waitKey()

二值化的图片:
在这里插入图片描述
2、然后进行腐蚀图片。腐蚀图片的意义就不在这里赘述了,大家有兴趣的自行百度搜索吧。

kernel = cv2.getStructuringElement(cv2.MORPH_CROSS, (7, 7))
img = cv2.dilate(img, kernel)
h, w = img.shape
cv2.imshow("img", img)
cv2.waitKey()
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值