计算机视觉
文章平均质量分 51
我叫鱼大
就职于中兴通讯和中国平安等上市公司 微信号:ai_hellohello
展开
-
【实战】钢筋计数,目标检测模型接口部署 python
一、背景推荐一个不错的博客的项目,钢筋点数。基于faster-rcnn模型的pytorch的接口部署。说到接口部署,我们得了解它是一种什么方式,怎么应用起来就是一个问题。我们使用过百度、腾讯、阿里的智能云服务时,大多数都是以API接口形式提供,通过接口,用户发送一张图片给API,api再返回去相应的内容,并告诉你如何解析。二、接口实现要靠web框架其实这并不难,我们的python web框架有很多,大家可以尝试tornado 、flask、以及Django。三、模型部署时需要...原创 2021-02-22 17:05:50 · 1788 阅读 · 2 评论 -
【思考】RGB彩色图卷积计算该怎么处理呢?很多人不理解特征图的个数与什么有关系
一、问题抛出当我们针对一个单通道的图进行卷积计算时,我们很容易知道卷积核划过每一块区域得到不同的值,每个区域的值组成一个特征图。但是当我们有几个通道的图,也就是我们见到的彩色图卷积计算该怎么处理呢?很多人不理解特征图的个数与什么有关系。二、背景说明这里先说明一下,多通道的彩色图一般为三通道RGB(红绿蓝),四通道则多了一个透明通道。假设我们是有一个四通道组成的彩色图像,我们有一个卷积核,那步骤是怎么样的。三、理解与记忆我们应该把四通道看成四个灰度图,像单通道的图片一样,卷积核..原创 2021-02-19 08:49:56 · 2526 阅读 · 8 评论 -
【思考】opencv python图像清晰度的检测算法靠谱吗?要认真思考一下
很多应用场景会对图片的质量有要求,因相机抖动或者物体处于运动时容易造成图片模糊。那么模糊的照片怎么去衡量呢?根据参考大量的方案-对图像进行梯度求解然后求方差,以方差的值作为评价图像的清晰程度。最为常用的或者说最为经典的是拉普拉斯算子进行的梯度计算。图像-》灰度-》拉普拉斯-》方差。import cv2imagePath ='./ai_hellohello.jpg'image = cv2.imread(imagePath)gray = cv2.cvtColor(image, cv2原创 2020-06-18 15:30:40 · 5476 阅读 · 0 评论 -
【技巧】opencv 报错‘depth‘ is 6 (CV_64F)全因numpy 默认float类型是float64位
opencv在读取numpy arr 时容易报错是'depth' is 6 (CV_64F),这个原因是因为numpy array float类型默认为64位,而opencv不能正常读取64位,可以读取float32位,因此,需要将numpy数组转化为float32位代替。float64转化为float32可以用astype()方法,参考下面的图很好理解。当类型转化为32位后,...原创 2020-03-10 09:12:55 · 6931 阅读 · 0 评论 -
【思考】目标检测中IOU的计算-【交集/并集怎么求】
原创 2020-02-16 11:06:32 · 1050 阅读 · 0 评论 -
【思考】目标检测最后的框怎么出现的-【NMS非极大值抑制】
一、引入目标检测定位出一张图片中某个类别都在哪里,模型在预测是会出现很多候选框,同时每个框都会有很多自己的一个置信度得分score,那么如何选出最后的那几个框呢?参见下图!二、概念:NMS: non maximum suppression,中文解释为“非极大值抑制”,听得非常不好理解,以我的认识可以理解在一定范围内选择最好的框,重叠过大的被舍弃。但是它的思路还是很好简单...原创 2020-02-16 09:43:44 · 2486 阅读 · 4 评论 -
【文章】从RCNN到SSD,这应该是最全的一份目标检测算法盘点
https://baijiahao.baidu.com/s?id=1598999301741831102&wfr=spider&for=pc目标检测是很多计算机视觉任务的基础,不论我们需要实现图像与文字的交互还是需要识别精细类别,它都提供了可靠的信息。本文对目标检测进行了整体回顾,第一部分从RCNN开始介绍基于候选区域的目标检测器,包括Fast R-CNN、Faster R-C...转载 2020-02-15 15:09:00 · 192 阅读 · 0 评论 -
【思考】一个像素点是什么颜色?理解彩色图片构成
RGB彩色图像中,一种彩色由R(红色),G(绿色),B(蓝色)三原色按比例混合而成。图像的基本单元是一个像素,就像一个巨幅电子广告屏上远处看是衣服图像,走近你会看到一个一个的方格,这个方格的颜色是一种,从远处看,觉察不到这个方格的存在。一个像素需要3块表示,分别代表R,G,B,如果8为表示一个颜色,就由0-255区分不同亮度的某种原色。一张9像素的8位RGB图像,在计算机内存中的分布大...原创 2019-11-12 14:37:27 · 11832 阅读 · 0 评论