Android OpenCV(二)主体识别 位置检测

前言

  工作中遇到需要通过OpenCV找到图片主体体积占图片百分比的比例,这里做一个问题解决思路的记录。该方面新手小白,有不对的地方可以评论指出哈 。

重要API

Sobel算法

Sobel 计算参考文章

索贝尔算子是计算机视觉领域的一种重要处理方法。
主要用于获得数字图像的一阶梯度,常见的应用和物理意义是边缘检测。
索贝尔算子是把图像中每个像素的上下左右四领域的灰度值加权差,在边缘处达到极值从而检测边缘。在技术上,它是一离散性差分算子,用来运算图像亮度函数的梯度之近似值。在图像的任何一点使用此算子,将会产生对应的梯度矢量或是其法矢量。索贝尔算子不但产生较好的检测效果,而且对噪声具有平滑抑制作用,但是得到的边缘较粗,且可能出现伪边缘。
该算子包含两组3x3的矩阵,分别为横向及纵向,将之与图像作平面卷积,即可分别得出横向及纵向的亮度差分近似值。如果以A代表原始图像,Gx及Gy分别代表经横向及纵向边缘检测的图像,其公式如下:
image.png
图像的每一个像素的横向及纵向梯度近似值可用以下的公式结合,来计算梯度的大小。[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-nJRhDdGQ-1674892594274)(https://upload-images.jianshu.io/upload_images/6188347-f1dde384106a4b75.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/124)]
然后可用以下公式计算梯度方向。 image.png
在以上例子中,如果以上的角度θ等于零,即代表图像该处拥有纵向边缘,左方较右方暗 【引用:百度百科】

//src : 输入图像  dst: 输出图像
//ddepth: 输出图像的深度(可以理解为数据类型),-1表示与原图像相同的深度
//dx:  dy: 当组合为dx=1,dy=0时求x方向的一阶导数,当组合为dx=0,dy=1时求y方向的一阶导数
//ksize: (可选参数)Sobel算子的大小,必须是1,3,5或者7,默认为3。
//scale: 对导数计算结果进行缩放的缩放因子,默认系数为1,不进行缩放
//delta: 偏值,在计算结果中加上偏值。
//borderType: 像素外推法选择标志。默认参数为BORDER_DEFAULT,表示不包含边界值倒序填充。
public static void Sobel(Mat src, Mat dst, int ddepth, int dx, int dy, int ksize, double scale, double delta, int borderType) 
  • 注意点
  1. 图像深度是指存储每个像素值所用的位数,例如cv2.CV_8U,指的是8位无符号数,取值范围为0~255,超出范围则会被截断(截断指的是,当数值大于255保留为255,当数值小于0保留为0,其余不变)。
      具体还有:CV_16S(16位无符号数),CV_16U(16位有符号数),CV_32F(32位浮点数),CV_64F(64位浮点数)
      当ddepth 输出图像深度采用CV_8U,由于Sobel算子在计算X方向梯度时,如果某像素点右侧像素值大于左侧像素值,则梯度大小为正保留,相反梯度大小为负被截断,梯度大小保存为0。这里可以使用 CV_32F 防止数据存在负数情况。

  2. 在我们使用CV_32F数据类型求出XY阶后,需要配合使用函数convertScaleAbs()将图像深度为CV_64F的梯度图像重新转化为CV_8U,这是由于函数cv2.imshow()的默认显示为8位无符号数,即[0,255]。

具体思路

  第一步,使用OpenCV的 Sobel算子来计算x,y方向上的梯度,在x方向上减去y方向上的梯度,通过这个减法,我们会留下有高水平梯度和低垂直梯度的图像区域。

        Mat gradX = new Mat();
        Mat gradY = new Mat();
        Mat binary = new Mat();
        //求X Y 阶 转换为32位浮点数个数
        Imgproc.Sobel(grayImage, gradX, CvType.CV_32F, 1, 0, -1);
        Imgproc.Sobel(grayImage, gradY, CvType.CV_32F, 0, 1, -1);
        //相减
        Core.subtract(gradX, gradY, binary);
        //转换数据格式CV_8U
        Core.convertScaleAbs(binary, binary);

以上步骤我们可以得到一个带有很多噪点的边界图,为了剔除掉那些噪点对于主体的判断,我们需要使用 blur 方法 和黑白两极化对图片进行处理

  第二步,使用低通滤泼器平滑图像(9 x 9内核),这将有助于平滑图像中的高频噪声。低通滤波器的目标是降低图像的变化率。如将每个像素替换为该像素周围像素的均值。这样就可以平滑并替代那些强度变化明显的区域。

//去噪
Imgproc.blur(binary, binary, new Size(9.0, 9.0));
//对模糊图像二值化。梯度图像中不大于90的任何像素都设置为0(黑色)。 否则,像素设置为255(白色)为第五步做准备工作
Imgproc.threshold(binary, binary, 90.0, 255.0, Imgproc.THRESH_BINARY | Imgproc.THRESH_OTSU);

  第三步,通过上述方法可以得到一个黑白图,但是图片中可能会存在很多空白空隙, 我们要用白色填充这些空余,使得后面的程序更容易识别昆虫区域,这需要做一些形态学方面的操作。

//为形态学操作返回指定大小和形状的结构元素 用于形态学处理
Mat kernel = Imgproc.getStructuringElement(Imgproc.MORPH_RECT, new Size(25.0, 25.0));
// 使用腐蚀和膨胀作为基本操作来执行高级形态学转换
Imgproc.morphologyEx(binary,binary,Imgproc.MORPH_CLOSE,kernel);

  第四步, 通过上述处理,可能还会存在一些 大的噪点, 可以通过形态学腐化和膨胀进行消除

Point p = new Point(-1.0, -1.0);
Imgproc.erode(binary, binary, ker, p, 4);
Imgproc.dilate(binary, binary, ker, p, 4);

  第五步,通过 findContours()函数框选出主体的位置信息

List<MatOfPoint> contours = new ArrayList<>();
Mat hierarchy = new Mat();
// binary : 要检索的图片,必须是为二值图,即黑白的
//hierarchy : 结果返回值
Imgproc.findContours(binary,contours,hierarchy,
                Imgproc.RETR_EXTERNAL,Imgproc.CHAIN_APPROX_SIMPLE);

findContours 函数 最后两个参数,mode 和 method 单独拿出来列举下 不同的参数代表的含义
mode
Imgproc.RETR_EXTERNAL 表示只检测外轮廓
Imgproc.RETR_LIST 检测的轮廓不建立等级关系
Imgproc.RETR_CCOMP 建立两个等级的轮廓,上面的一层为外边界,里面的一层为内孔的边界信息。如果内孔内还有一个连通物体,这个物体的边界也在顶层。
Imgproc.RETR_TREE 建立一个等级树结构的轮廓。

method
Imgproc.CHAIN_APPROX_NONE 存储所有的轮廓点,相邻的两个点的像素位置差不超过1,即max(abs(x1-x2),abs(y2-y1))==1
Imgproc.CHAIN_APPROX_SIMPLE 压缩水平方向,垂直方向,对角线方向的元素,只保留该方向的终点坐标,例如一个矩形轮廓只需4个点来保存轮廓信息

  结果都存储在 contours 数组中,我们可以使用他进行一些业务判断。
  由于脱敏原因,这里没有demo图片,该篇文章 主要参考文章对我的帮助非常大,小白这里只是做一个开发记录,今天的这篇文章就到这里。

参考文章

识别颜色方块并提取轮廓

OpenCV自动检测图像中的物体并裁剪

Sobel()计算图像梯度的细节讲解

OpenCV API官网地址

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Android OPenCV 4.8是一个强大的人脸识别工具,可在Android设备上进行人脸识别的开发。它基于OpenCV库,提供了许多功能强大的特征和算法来检测识别人脸。 使用Android OPenCV 4.8进行人脸识别需要进行以下步骤: 1. 导入OpenCV库:首先,需要将OpenCV库导入到Android项目。可以下载OpenCV Android SDK并将其导入到项目,然后在gradle文件配置相关依赖。 2. 初始化OpenCV:在应用程序启动时,需要初始化OpenCV库,以便能够使用其功能。这可以通过在应用程序的主活动添加一些代码来实现。 3. 图像预处理:在进行人脸识别之前,需要对图像进行预处理。这可能包括降噪、增强对比度和明暗等操作,以提高识别的准确性。 4. 人脸检测:使用OpenCV提供的人脸检测器,可以在图像检测出人脸区域。可以使用Haar特征分类器来实现人脸检测,该分类器训练了大量的正负样本来识别人脸。 5. 特征提取:一旦检测到人脸区域,就可以从提取出一些关键特征,例如眼睛的位置、嘴巴的位置等。这些特征将用于后续的人脸识别过程。 6. 人脸识别:使用提取的特征,可以将其与预先存储的已知人脸特征进行比较。可以使用各种算法,如人脸识别一对一、一对多等。 7. 结果展示:根据识别的结果,可以将结果展示给用户。可以显示识别的人脸名称或其他相关信息。 总之,Android OPenCV 4.8是一种实现人脸识别的强大工具,它提供了一系列功能和算法来实现人脸检测、特征提取和人脸识别等任务。使用这个工具,我们可以开发出各种应用,如人脸解锁、人脸支付等。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值