自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

原创 基于anchor-free的目标检测算法CenterNet研究

2020.04.18 小记 近期一直在MOT算法研究,目前SOTA算法核心还是基于CenterTrack网络,而CenterTrack又是基于anchor-free式的CenterNet网络,CenterNet是继YOLO目标检测算法以来新创的目标检测派系,yolo系列都是anchor-base...

2020-04-20 16:36:06 368 0

原创 MOT榜前算法探讨

复工了,久违了。 目标跟踪一直是计算机视觉里无法回避的课题,无论是单目标跟踪SOT还是今天要讨论的多目标跟踪MOT,是视频理解里的重要组成部分。其任务一般包括单目标跟踪(SOT,Single Object Tracking),多目标跟踪(MOT,Multi-Object Tracking),...

2020-04-17 15:24:00 325 0

原创 MTCNN算法简介

主页:https://kpzhang93.github.io/MTCNN_face_detection_alignment/index.html论文:https://arxiv.org/abs/1604.02878代码:官方matlab版、C++ caffe版第三方训练代码:tensorflow、...

2020-01-16 14:17:21 317 0

原创 PS高效修图

常用工具 一、污点修复画笔 1.调节大小:p后面的【】进行调节 2.类型:内容识别(常用)/创建纹理/近似匹配 3.内容识别:点击需要修复的区域。软件会自动在他周围进行取样,通过计算对其进行光线和明暗的匹配,并进行羽化融合 4.创建纹理:可以创建纹理,纹理为ps自带不可修改 5.近似匹...

2019-12-28 10:03:55 119 0

原创 MobileNet,从V1到V3

参考文献: 1.https://zhuanlan.zhihu.com/p/70703846

2019-10-29 14:03:39 232 1

原创 训练自己的实例分割模型

注:2019年04月05日刚出炉的paper Abstract:我们提出了一个用于实时实例分割的简单全卷积模型,在单个Titan Xp上以33 fps在MS COCO上实现了29.8 mAP,这比以前的任何算法都要快得多。此外,我们只在一个GPU上训练后获得此结果。我们通过将实例分割分成两个并行...

2019-10-22 15:04:36 1230 4

原创 图像处理之阴影检测实例BDRAR

paper :Bidirectional Feature Pyramid Network with Recurrent Attention Residual Modules for Shadow Detection github:BDRAR Preparation Set the path ...

2019-09-27 14:15:32 280 0

原创 Shadow Detection

课题背景 阴影检测向来是计算机视觉中基础且富有挑战性的问题——对于一张输入图像,我们通过生成二进制图像来标记阴影区域,阴影区域的检测为进一步获取图像中的光照情况、物体的形状与位置,以及摄像机的参数提供了可能。与此同时,阴影的存在也为计算机视觉中进一步理解图像的算法,例如物体的检测与跟踪,带来...

2019-09-25 14:02:29 316 1

原创 视频摘要算法综述 ==》Video Synopsis

广义上来说,摘要可以分为2种,第一种是直接提取视频中的关键帧合成新的视频,该方法虽然也可以缩短视频的时长,但是合成后视频给人一种快进看电影的感觉,而且实际使用较少,所用的方法包括SEDIM,SEDIM-IN,CEA,TEA等方法。 这里分享一个修改后的SEDIM程序,效果很好,http://do...

2019-09-24 11:52:41 1075 0

原创 OCR:ASTER-基于空间变换的自然场景的文本识别算法

白翔老师团队开源了 ASTER,一种基于空间变换的自然场景的文本识别算法,最开始出现于CVPR2016的论文,登上了PAMI。 它是文本识别算法,不包括文本检测,对于输入的检测到的文本图像块,识别出相应字符。 该代码值得推荐的理由: 1.高精度。 2.高速度。 3.已经申请了专利。并获得了专...

2019-09-03 16:07:39 900 0

原创 yolo3训练人脸检测模型

YOLOv3-model-pruning 用 YOLOv3 模型在一个开源的人手检测数据集oxford hand上做人手检测,并在此基础上做模型剪枝。对于该数据集,对 YOLOv3 进行 channel pruning 之后,模型的参数量、模型大小减少 80% ,FLOPs 降低 70%,前向推...

2019-08-24 14:52:40 315 1

转载 Learning Efficient Convolutional Networks through Network Slimming

模型剪枝:https://blog.csdn.net/h__ang/article/details/89376079

2019-08-21 15:07:54 200 0

原创 SLAM简介

SLAM 是什么? SLAM 是同步定位与地图构建 (Simultaneous Localization And Mapping) 的缩写,最早由 Hugh Durrant-Whyte 和 John J.Leonard 提出。SLAM 主要用于解决移动机器人在未知环境中运行时定位导航与地图构建的...

2019-08-07 14:14:24 1049 0

原创 图像分割算法综述

图像分割是计算机视觉研究中的一个经典难题,已经成为图像理解领域关注的一个热点,图像分割是图像分析的第一步,是计算机视觉的基础,是图像理解的重要组成部分,同时也是图像处理中最困难的问题之一。所谓图像分割是指根据灰度、彩色、空间纹理、几何形状等特征把图像划分成若干个互不相交的区域,使得这些特征在同一区...

2019-08-06 16:28:19 557 0

原创 labelme标注工具使用

labelme标注工具再转化.json文件有一个缺陷,一次只能转换一个.json文件,然而深度学习的项目通常需要大量的数据,那么转换.json文件就是一个比较耗时的工作;因此,对labelme做出了改进,可以实现批量转换.json文件。 安装 sudo apt-get install ...

2019-08-02 16:57:19 1088 0

原创 opencv进阶-背景建模-(帧差法与混合高斯模型)

背景减除(Background Subtraction)是许多基于计算机视觉的任务中的主要预处理步骤。如果我们有完整的静止的背景帧,那么我们可以通过帧差法来计算像素差从而获取到前景对象。但是在大多数情况下,我们可能没有这样的图像,所以我们需要从我们拥有的任何图像中提取背景。当运动物体有阴影时,由于...

2019-07-19 10:01:28 1908 3

原创 《U-Net: Convolutional Networks for Biomedical Image Segmentation》论文阅读之UNet

论文地址:http://www.arxiv.org/pdf/1505.04597.pdf 图像分割在从自动驾驶汽车到卫星的许多领域都很有用。也许其中最重要的是医学影像。医学图像的微妙之处是相当复杂的。一台能够理解这些细微差别并识别出必要区域的机器,可以对医疗保健产生深远的影响。 卷积神经网络在简...

2019-07-06 15:43:33 1262 0

原创 点云配准

稀疏点云重建步骤: 场景的三维重建问题可总结为:从二维空间中的点估计相机的位置、投影矩阵以及恢复场景在三维空间中的点。 附: 1.视觉测量和三维重建 2.人体三维重建与尺寸测量 3.基于双目视觉的三维重建与测量技术研究 4.双目立体视觉的三维重建方...

2019-06-25 19:16:10 559 0

原创 Image Registration

(不得不感叹下,玩深度学习特别是CV的朋友们,你们辛苦了!一朝入坑,处处有坑。一路走来,从SR,ReID,Image inpainting ,action detection,pose estimation,stereo matching 到VSR,无人驾驶,到今天的Image Registrat...

2019-06-22 17:24:01 1276 0

原创 双目立体匹配算法详解

双目立体匹配介绍 真实场景的双目立体匹配(Stereo Matching)获取深度图详解   双目立体匹配一直是双目视觉的研究热点,双目相机拍摄同一场景的左、右两幅视点图像,运用立体匹配匹配算法获取视差图,进而获取深度图。而深度图的应用范围非常广泛,由于其能够记录场景中物体距离摄像机的距离...

2019-06-19 10:28:55 8329 0

原创 《Stereo Matching by Training a Convolutional Neural Network to Compare Image Patches》论文阅读之MC-CNN

通过训练卷积神经网络比较图像块的立体匹配 project主页:https://github.com/jzbontar/mc-cnn 基于patch的提取与比较,学习其相似性得到一个matching cost,并将正确匹配的patch定义为正样本,其他为负样本。 后处理包括:cross-based...

2019-06-18 19:55:33 579 1

原创 《Two-Stream Adaptive Graph Convolutional Networks for Skeleton-Based Action Recognition》论文阅读之2s-AGCN

paper:2s-AGCN code :2s-AGCN 摘要 在基于骨架的动作识别中,将人体骨架建模为时空图的图形卷积网络(GCN)取得了显著的效果。然而,在现有的基于GCN的方法中,图的拓扑结构是手动设置的,并且它固定在所有层和输入样本上。对于行动识别任务中的分层GCN和不同的样本,这...

2019-06-17 14:01:28 2372 0

原创 《EDVR: Video Restoration with Enhanced Deformable Convolutional Networks》论文阅读之EDVR

在CVPR 2019 Workshop NTIRE 2019 视频恢复比赛中,来自商汤科技、港中文、南洋理工、深圳先进技术研究院的联合研究团队获得了全部四个赛道的所有冠军! 近日,作者们已经将所使用的EDVR算法论文发布于arXiv,并称代码将于本月开源。 NTIRE Workshop 全称为...

2019-06-13 14:29:36 4509 1

转载 图卷积网络GCN理解

图卷积网络(Graph Convolutional Network,GCN)是近年来逐渐流行的一种神经网络结构。不同于只能用于网格结构(grid-based)数据的传统网络模型 LSTM 和 CNN,图卷积网络能够处理具有广义拓扑图结构的数据,并深入发掘其特征和规律,例如 PageRank 引用网...

2019-06-12 17:31:23 3785 0

原创 基于pytorch的EDSR/WDSR实现

对于原版官方EDSR,按照以下命令测试即可, #1. my test on EDSR x4 res: 12.68s ,saving 25s python3 main.py --data_test Demo --scale 4 --n_resblocks 32 --n_feats 256 --...

2019-06-03 16:16:12 2109 12

原创 《Recurrent Back-Projection Network for Video Super-Resolution》论文阅读之RBPN

Recurrent Back-Projection Network for Video Super-Resolution - CVPR2019 paper:https://arxiv.org/pdf/1801.04590v4.pdfcode:https://github.com/alterzer...

2019-05-30 15:28:47 2011 15

转载 CVPR 2019 论文汇总(按方向划分,0524 更新中)

CVPR 2019 论文汇总(按方向划分,0524 更新中)

2019-05-30 13:35:47 640 0

原创 基于深度学习的图像超分论文推荐

时隔一年,重新回顾超分领域,真是读论文的速度赶不上发论文的速度,一年不见,已经出现了不少优秀的paper。先来一波, CVPR2019中关于超分辨率算法的16篇论文压压惊。 好了,上干货,开始我们的重点,首先介绍下概念: 超分辨率(Super Resolution,SR) 超分辨率是一项底...

2019-05-29 11:10:58 4116 0

原创 《Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition》论文阅读之ST-GCN

近日,香港中文大学提出一种时空图卷积网络,并利用它们进行人类行为识别。这种算法基于人类关节位置的时间序列表示而对动态骨骼建模,并将图卷积扩展为时空图卷积网络而捕捉这种时空的变化关系。 近年来,人类行为识别已经成为一个活跃的研究领域,它在视频理解中起着重要的作用。一般而言,人类行为识别有着多种模...

2019-05-27 19:44:02 1740 4

原创 行为动作识别

随着计算机学科与人工智能的发展和应用,视频分析技术迅速兴起并得到了广泛关注。视频分析中的一个核心就是人体行为识别,行为识别的准确性和快速性将直接影响视频分析系统后续工作的结果。因此,如何提高视频中人体行为识别的准确性和快速性,已成为视频分析系统研究中的重点问题。 目前,典型的视频人体行为识别方法...

2019-05-23 15:48:56 6806 2

原创 光流法运动目标检测

接上篇,OpenCV视频目标跟踪及背景分割器,本篇介绍OpenCV—python目标跟踪==》光流法 回顾: 目标跟踪是对摄像头视频中的移动目标进行定位的过程。实时目标跟踪是许多计算机视觉应用的重要任务,如监控、基于感知的用户界面、增强现实、基于对象的视频压缩以及辅助驾驶等。关于实现视频目标跟...

2019-05-21 10:07:11 3953 1

原创 特征检测与特征匹配算法简介

特征检测 opencv可以检测图像的主要特征,然后提取这些特征,使其成为图像描述符。 特征:特征就是有意义的图像区域,该区域具有独特性或易于识别性。角点与高密度区域是一个很好的特征,边缘可以将图像分为两个区域,因此可以看作很好的特征,斑点(与周围有很大区别的图像区域)也是有意义的特征。 大...

2019-05-20 13:22:17 5038 0

原创 docker安装及使用

Docker介绍: Docker 是一个开源的应用容器引擎,Docker 可以让开发者打包他们的应用以及依赖包到一个轻量级、可移植的容器中,然后发布到任何流行的 Linux 机器上,也可以实现虚拟化。虚拟化在计算领域指的是计算机的各种资源的虚拟化,如服务器,网络,存储等,予以抽象 转换后呈现出...

2019-05-08 13:11:49 177 0

原创 《RMPE: Regional Multi-Person Pose Estimation》论文阅读之AlphaPose

首先附上论文地址:https://arxiv.org/pdf/1612.00137.pdf 作者:上海交大卢策吾老师组AlphaPose项目地址:https://github.com/MVIG-SJTU/AlphaPose 亮点:提出了一种 regional multi-person pose e...

2019-05-07 15:47:09 2052 0

原创 《Pose Flow: Efficient Online Pose Tracking》论文解读之PoseFlow

工作组:上交卢老师团队 发表处:BMVC 开源代码:https://github.com/YuliangXiu/PoseFlow独立版本 GitHub实现:https://github.com/MVIG-SJTU/AlphaPose/tree/master/PoseFlow Paper:P...

2019-05-07 13:54:14 719 0

原创 Human Pose Estimation姿态估计调研

介绍 姿态估计的目标是在RGB图像或视频中描绘出人体的形状,这是一种多方面任务,其中包含了目标检测、姿态估计、分割等等。有些需要在非水平表面进行定位的应用可能也会用到姿态估计,例如图形、增强现实或者人机交互。姿态估计同样包含许多基于3D物体的辨认。给定一幅图像或一段视频,人体姿态估计就是去恢复其...

2019-05-06 11:44:39 1238 0

原创 论文阅读之《CrowdPose: Efficient Crowded Scenes Pose Estimation and A new Benchmark》

介绍 近日,上海交通大学电子信息与电气工程学院卢策吾团队(MVIG组)的论文《CrowdPose: Efficient Crowded Scenes Pose Estimation and A New Benchmark》被CVPR2019(计算机视觉领域顶级会议)接收。该论文主要是针对此...

2019-05-06 11:23:26 612 0

原创 darknet GPU版本编译及YOLOv3训练新数据

GPU版本编译 如图,按照官网方式直接编译darknet,实际上默认是CPU版本,测试后,比较慢,如图: 所以这里我们直接将其编译为GPU版本,需要更改以下几个地方: 1. 更改Makefile前两行GPU和CUDNN的配置: GPU=1 CUDNN=1 (OPENCV ...

2019-04-04 14:21:24 577 1

原创 C++11 相关小结

文档相关 首先,wiki是最全面的:https://en.wikipedia.org/wiki/C%2B%2B11,这是C++完整的新功能,个人使用的编译器可能不完整支持,可以看这个编译器+版本对C++1X的支持情况:http://en.cppreference.com/w/cpp/compil...

2019-04-03 14:35:13 125 0

转载 卡尔曼滤波器介绍

最经典的跟踪算法莫过于卡尔曼老爷子在1960年提出的卡尔曼滤波器。在无人车领域,卡尔曼滤波器除了应用于障碍物跟踪外,也在车道线跟踪、障碍物预测以及定位等领域大展身手。 工作原理 简单来讲,卡尔曼滤波器就是根据上一时刻的状态,预测当前时刻的状态,将预测的状态与当前时刻的测量值进行加权,加权后的结...

2019-04-03 10:30:43 1440 2

提示
确定要删除当前文章?
取消 删除