计算机视觉
马里奥奥利奥
这个作者很懒,什么都没留下…
展开
-
姿态估计 OpenPose: Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields 论文笔记
论文地址:https://arxiv.org/abs/1611.08050项目代码:https://github.com/CMU-Perceptual-Computing-Lab/openpose/原创 2019-04-01 16:56:07 · 397 阅读 · 0 评论 -
CenterNet 训练自己的数据集
github地址:https://github.com/Duankaiwen/CenterNet论文:https://arxiv.org/abs/1904.081891、在github上下载,配置好环境。2、准备数据把自己的数据转化为coco的格式,网上有很多工具可以下载使用。我的数据是yolo格式的,需要的话可以提供我的yolo to coco的代码。yolo to coco数据...原创 2019-08-30 12:02:41 · 9581 阅读 · 49 评论 -
目标检测mAP的含义与计算
1、Precision,RecallPrecision=正确的检测框/(正确的检测框+错检)Recall = 正确的检测框/(正确的检测框+漏检)2、mAPmAP是目标检测下的重要指标。大致为不同recall值下的precision和。计算如下:1、对所有检测框按照置信度排序。2、对各个检测框计算其为正确or错检。 判断检测框是否正确使用的是IOU值,一般默认I...原创 2019-08-01 17:30:25 · 616 阅读 · 1 评论 -
python+opencv 绘制检测框
1、利用cv2.rectangle()绘制bounding boximport cv2cv2.rectangle(img, (x,y), (x+w,y+h), (B,G,R), Thickness)参数如下:img:图像(x,y):bounding box左上角点坐标,图像最左上角坐标为(0,0)(x+w,y+h):bounding box右下角点坐标(B,G,...原创 2019-07-31 17:25:33 · 2400 阅读 · 0 评论 -
Unet学习与理解
Unet是对FCN的改进,FCN实现了端到端的图像分割,但是也有缺点:细节处理的不够好,下图是fcn的网络结构。对最后的heatmap进行上采样,与pool4拼接(不是相加),再上采样与pool3拼接,再上采样至原图像大小。下图是Unet的网络结构。左边是特征提取部分,右边是上采样部分。由于网络结构像U型,所以叫Unet。这个图表达的很清晰了。在特征提取部分:1、3*3的卷积操...原创 2019-04-09 21:11:27 · 5195 阅读 · 1 评论 -
FCN的学习与理解
今天再次看了一遍fcn,对它的理解更深了。一句话概括FCN:FCN将传统网络后面的全连接层换成了卷积层。说一下我对fcn意义的理解: 1、输出从一个一维向量转化成了高维特征图,如下图的例子,输出从4096—>1*1*4096,两者都是4096个数值,数值是一样的,但是结构不一样,后者符合图像的二维结构。这样就可以后续进行图像分割。 2、如果说是一张有多个对象的图,...原创 2019-04-09 19:39:38 · 1197 阅读 · 2 评论 -
【human estimation】人体姿态检测的关键问题
今天给老师汇报了一下OpenPose的论文和人体姿态检测的学习进展。自以为把论文已经看的挺熟的了,代码也跑起来了,但是还是被老师问的哑口无言,记录一下,作为我之后学习human estimation的方向。1、首先对于最简单的只有单人的图片的姿态检测,如何实现。 最简单的就是用up-down,先用一个human detector检测出人,然后再检测part的heatmap。那么hea...原创 2019-04-08 22:00:38 · 890 阅读 · 0 评论 -
【tf-pose-estimation】人体姿态识别tensorflow版OpenPose Ubuntu16.04安装全过程
3记录一下openpose tf版本的安装全流程,踩了所有的坑,希望你可以一次性安装成功。环境:Ubuntu16.04+Anaconda3code:https://github.com/ildoonet/tf-pose-estimationpaper:https://arxiv.org/pdf/1611.08050.pdf1)创建虚拟环境+安装cuda+cudnn+tensorf...原创 2019-04-08 20:19:36 · 4647 阅读 · 17 评论 -
非极大值抑制(Non-maximum suppression)
算法本质是搜索局部极大值,抑制非极大值元素。在图像检测中应用的很多,目的就是要去除冗余的检测框,保留最好的一个,直观图如下:python代码如下:def py_cpu_nms(dets, thresh): """Pure Python NMS baseline.""" #x1、y1、x2、y2、以及score赋值 x1 = dets[:, 0] ...原创 2019-04-02 19:07:03 · 160 阅读 · 0 评论 -
A Framework for Human Pose Estimation in Videos 部分翻译
视频中的人体姿态估计框架介绍 人体姿态估计对于许多计算机视觉应用是至关重要的,包括人机交互、活动识别和视频监控。人体姿态估计是一个有挑战性的问题,因为它具有大的外观差异,人体的非刚性,背景杂乱和自我遮挡等特点。最近,人体姿态估计在解决无约束的单幅图像问题上取得了重大进展; 然而,视频中的人体姿态估计仍是一个相对较新且前景广阔的问题,需要进行改进。显然,可以将基于单个图像的姿势估...原创 2019-04-01 17:03:03 · 171 阅读 · 0 评论 -
论文阅读《CenterNet: Keypoint Triplets for Object Detection》
论文阅读《CenterNet: Keypoint Triplets for Object Detection》论文idea论文idea现在最流行的目标检测是传统基于anchor的,但是存在的问题:需要大量的anchors来保证足够高的IOUanchor的比例和尺寸需要手工设置anchors与ground-truthboxes不对齐,不利于边界框分类任务。于是CornerNet被提出...原创 2019-08-31 10:50:42 · 266 阅读 · 0 评论