Paper Reading
文章平均质量分 92
山水之间2018
山水之间落花雨,悲欢之外快活人
展开
-
《Motion Forecasting with Dual Consistency and Multi-Pseudo-Target Supervision》论文阅读之DCMS
DCMS:具有双重一致性和多伪目标监督的运动预测香港科技大学暂无代码。我们提出了一种具有双重一致性约束和多伪目标监督的运动预测新框架。运动预测任务通过结合过去的空间和时间信息来预测车辆的未来轨迹。DCMS的一个关键设计是提出双重一致性约束,在训练阶段在空间和时间扰动下对预测的轨迹进行规范化。此外,我们设计了一种新颖的自集成方案来获得准确的伪目标,以通过显式监督多目标来模拟运动预测中的多模态,即多伪目标监督。我们在Argoverse运动预测基准上的实验结果表明,DCMS显著优于最先进的方法,在排行榜上名列第一原创 2022-07-08 16:13:48 · 508 阅读 · 0 评论 -
《HiVT: Hierarchical Vector Transformer for Multi-Agent Motion Prediction》论文阅读之HiVT
目录摘要1.介绍2.相关工作3.方法3.1. 总体框架3.2 场景表示 3.3 分层向量Transformer3.3.1 局部编码器3.3.2 全局交互模块3.3.3 多模态未来解码器3.4 训练4.实验4.1 实验设置4.2 消融研究 4.3. 结果5.结论 准确预测周围交通参与者的未来运动对于自动驾驶车辆的安全至关重要。最近,矢量化方法由于能够捕捉交通场景中的复杂交互而在运动预测领域占据主导地位。然而,现有的方法忽略了问题的对称性并且受到昂贵的计算成本的影响,面临着在不牺牲预测性能的情况原创 2022-07-05 09:57:15 · 2553 阅读 · 0 评论 -
轨迹预测相关论文--持续更新
轨迹预测原创 2022-06-28 11:40:10 · 1691 阅读 · 0 评论 -
《Generative Image Inpainting with Adversarial Edge Learning》论文阅读之edge-connect
Paper:edge-connectcode1:edge-connectcode2:Anime-InPainting 使用对抗边缘学习进行生成图像修复背景在过去几年中,深度学习技术在图像修复方面取得了显着进步。然而,许多这些技术无法重建合理的结构,因为它们通常过度平滑和/或模糊。比如或者合成结果很好,视觉效果真实,但和原始照片却不一样。比如:...原创 2019-02-22 14:38:39 · 8056 阅读 · 14 评论 -
论文阅读之《CrowdPose: Efficient Crowded Scenes Pose Estimation and A new Benchmark》
介绍 近日,上海交通大学电子信息与电气工程学院卢策吾团队(MVIG组)的论文《CrowdPose: Efficient Crowded Scenes Pose Estimation and A New Benchmark》被CVPR2019(计算机视觉领域顶级会议)接收。该论文主要是针对此前AlphaPose系统的优化,构建了CrowdPose数据集,用来衡量算法在拥挤场景中的性...原创 2019-05-06 11:23:26 · 2103 阅读 · 0 评论 -
《Pose Flow: Efficient Online Pose Tracking》论文解读之PoseFlow
工作组:上交卢老师团队发表处:BMVC开源代码:https://github.com/YuliangXiu/PoseFlow独立版本GitHub实现:https://github.com/MVIG-SJTU/AlphaPose/tree/master/PoseFlowPaper:PoseFlow介绍多人姿态跟踪方法,其主要方法和多人姿态检测一样,也可以分为自顶向下...原创 2019-05-07 13:54:14 · 2167 阅读 · 0 评论 -
《RMPE: Regional Multi-Person Pose Estimation》论文阅读之AlphaPose
首先附上论文地址:https://arxiv.org/pdf/1612.00137.pdf作者:上海交大卢策吾老师组AlphaPose项目地址:https://github.com/MVIG-SJTU/AlphaPose亮点:提出了一种 regional multi-person pose estimation(RMPE) 框架,框架包括三个部分效果:最新的AlphaPose在MPII数据集...原创 2019-05-07 15:47:09 · 4483 阅读 · 0 评论 -
《Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition》论文阅读之ST-GCN
近日,香港中文大学提出一种时空图卷积网络,并利用它们进行人类行为识别。这种算法基于人类关节位置的时间序列表示而对动态骨骼建模,并将图卷积扩展为时空图卷积网络而捕捉这种时空的变化关系。近年来,人类行为识别已经成为一个活跃的研究领域,它在视频理解中起着重要的作用。一般而言,人类行为识别有着多种模态(Simonyan and Zisserman 2014; Tran et al. 2015; W...原创 2019-05-27 19:44:02 · 6864 阅读 · 4 评论 -
CVPR 2019 论文汇总(按方向划分,0524 更新中)
CVPR 2019 论文汇总(按方向划分,0524 更新中)转载 2019-05-30 13:35:47 · 1202 阅读 · 0 评论 -
《Recurrent Back-Projection Network for Video Super-Resolution》论文阅读之RBPN
Recurrent Back-Projection Network for Video Super-Resolution - CVPR2019paper:https://arxiv.org/pdf/1801.04590v4.pdfcode:https://github.com/alterzero/RBPN-PyTorchProject page:https:/...原创 2019-05-30 15:28:47 · 4313 阅读 · 16 评论 -
《EDVR: Video Restoration with Enhanced Deformable Convolutional Networks》论文阅读之EDVR
在CVPR 2019 Workshop NTIRE 2019 视频恢复比赛中,来自商汤科技、港中文、南洋理工、深圳先进技术研究院的联合研究团队获得了全部四个赛道的所有冠军!近日,作者们已经将所使用的EDVR算法论文发布于arXiv,并称代码将于本月开源。NTIRE Workshop 全称为:paper :EDVRcode:EDVR内容简介视频恢复不是图像恢复...原创 2019-06-13 14:29:36 · 8792 阅读 · 1 评论 -
《Two-Stream Adaptive Graph Convolutional Networks for Skeleton-Based Action Recognition》论文阅读之2s-AGCN
paper:2s-AGCNcode :2s-AGCN摘要在基于骨架的动作识别中,将人体骨架建模为时空图的图形卷积网络(GCN)取得了显著的效果。然而,在现有的基于GCN的方法中,图的拓扑结构是手动设置的,并且它固定在所有层和输入样本上。对于行动识别任务中的分层GCN和不同的样本,这可能不是最佳选择。此外,在现有的方法中,很少研究骨骼数据的二阶信息(骨骼的长度和方向),这对于动作识...原创 2019-06-17 14:01:28 · 5867 阅读 · 0 评论 -
《U-Net: Convolutional Networks for Biomedical Image Segmentation》论文阅读之UNet
论文地址:http://www.arxiv.org/pdf/1505.04597.pdf图像分割在从自动驾驶汽车到卫星的许多领域都很有用。也许其中最重要的是医学影像。医学图像的微妙之处是相当复杂的。一台能够理解这些细微差别并识别出必要区域的机器,可以对医疗保健产生深远的影响。卷积神经网络在简单的图像分割问题上取得了不错的效果,但在复杂的图像分割问题上却没有取得任何进展。这就是UNet的作用。...原创 2019-07-06 15:43:33 · 7263 阅读 · 2 评论 -
Learning Efficient Convolutional Networks through Network Slimming
模型剪枝:https://blog.csdn.net/h__ang/article/details/89376079转载 2019-08-21 15:07:54 · 607 阅读 · 0 评论 -
《Human Semantic Parsing for Person Re-identification》论文阅读之SPReID
论文地址GitHub代码Introduction目前大部分的Person ReID方法都开始集中于提取更加具有表征能力的局部特征辅助全局特征用于行人检索。这篇文章是CVPR2018中关于Person ReID的一篇,文章的主体思路就是part-base的方法,但是跟大部分part-base不一样的地方在于本文使用了行人分割支路的输出作为mask,然后对人体的各部件进行局部特征提取...原创 2019-01-31 10:45:45 · 1374 阅读 · 32 评论 -
《Detecting Text in Natural Image with Connectionist Text Proposal Network》论文阅读之CTPN
前言2016年出了一篇很有名的文本检测的论文:《Detecting Text in Natural Image withConnectionist Text Proposal Network》,这个深度神经网络叫做CTPN,直到今天这个网络框架一直是OCR系统中做文本检测的一个常用网络,极大地影响了后面文本检测算法的方向。这个算法很有创新,我打算一步一步介绍其闪光点。摘要问题分析...原创 2018-10-22 15:59:54 · 1836 阅读 · 0 评论 -
《Qua Vadis, Action Recognition? A New Model and the Kinetics Dataset》论文解读之Two-Stream I3D
本文是CVPR 2017的一篇文章Paper:Quo Vadis, Action Recognition? A New Model and the Kinetics Datasetgithub: kenetics-i3d 在一个规模更大的新video数据集Kinetics上,重新评估了当下state-of-the-art的模型结构,并和在小数据集上训练的结构进行比较 提出一个新模...原创 2018-07-25 19:47:17 · 11733 阅读 · 1 评论 -
AlignedReID : 最短路径的理解
论文读完以后,一直也没有仔细思考动态对齐的细节实现,如何直观的理解Face++提出的AlignedReID最短路径的原理和算法,我们直接用图来解释。动态规划如图所示,乍一看,这条最短路径上有一些边是冗余的,例如图中的第一条边。为什么不只寻找那些匹配的边呢?作者给出的解释是这样的:局部信息不仅要自我匹配,也要考虑到整个人体对齐的进程。为了使匹配能够从头到脚按顺序进行,那么有一些冗余的匹配是必须的。另...原创 2018-05-27 11:22:34 · 3416 阅读 · 0 评论 -
《Learning Discriminative Features with Multiple Granularities for Person Re-Identification》论文阅读之MGN
刷新三数据集纪录的跨镜追踪(行人再识别-ReID)技术云从科技在跨镜追踪(行人再识别)技术(ReID)上获取重大突破。同时在Market-1501,CUHK03,DukeMTMC-reID三个数据集刷新了世界纪录,其中最高在Market-1501上的首位命中率(Rank-1 Accuracy)达到96.6%,让跨镜追踪(ReID)在准确率上首次达到商用水平,人工智能即将从「刷脸」跨到「识人」的新纪...原创 2018-06-11 10:48:44 · 8370 阅读 · 1 评论 -
《Deep Back-Projection Networks For Super-Resolution》论文阅读之DBPN
Deep Back-Projection Networks For Super-Resolutionpaper: Deep Back-Projection Networks For Super-ResolutionPyTorch: alterzero/DBPN-PytorchCaffe:alterzero/DBPN-caffe导读:这篇文章是CVPR 2018年的文章,相较同时录用的《Residu...原创 2018-06-12 14:33:06 · 5314 阅读 · 3 评论 -
《DeblurGAN: Blind Motion Deblurring Using Conditional Adversarial Networks》论文阅读之DeblurGAN
前言现实生活中,大多数图片是模糊不清的,试想一下,追剧时视频不清晰,看着都很捉急,何况现实中好端端的一幅美景(美女也可以)被抓拍得不忍直视,瞬间暴躁!!拍照时手抖,或者画面中的物体运动都会让画面模糊,女友辛辛苦苦摆好的各种Pose也将淹没在各种模糊的线条中,是时候要有一种新的算法解救水深火热中的你了。这不,去年(2017)乌克兰天主教大学、布拉格捷克理工大学和解决方案提供商Eleks联手公布了一篇...原创 2018-06-13 11:14:28 · 10227 阅读 · 3 评论 -
《Mask R-CNN》论文阅读之Mask R-CNN
导读Mask R-CNN是ICCV 2017的best paper,彰显了机器学习计算机视觉领域在2017年的最新成果。在机器学习2017年的最新发展中,单任务的网络结构已经逐渐不再引人瞩目,取而代之的是集成,复杂,一石多鸟的多任务网络模型。Mask R-CNN就是典型的代表。本篇大作的一作是何凯明,在该篇论文发表的时候,何凯明已经去了FaceBook。Mask-RCNN 大体框架还是 F...原创 2018-06-14 09:55:53 · 4050 阅读 · 0 评论 -
《Rich feature hierarchies for accurate object detection and semantic segmentation》论文阅读之R-CNN
paper:《Rich feature hierarchies for Accurate Object Detection and Segmentation 》原创 2018-06-14 13:53:43 · 842 阅读 · 0 评论 -
《Beyond Part Models: Person Retrieval with Refined Part Pooling 》PCB论文解读
论文链接:Beyond Part Models: Person Retrieval with Refined Part Pooling本文纯属个人观点,如有错误欢迎指正,谢谢!Beyond Part Models: Person Retrieval with Refined Part Pooling(and A Strong Convolutional Baseline)本文和旷视那篇Aligne...原创 2018-05-17 16:20:58 · 7717 阅读 · 5 评论 -
《Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition》论文阅读之SPPNet
待更新............原创 2018-06-14 16:57:06 · 553 阅读 · 0 评论 -
《Fast R-CNN》论文阅读之Fast R-CNN
Fast R-CNNRoss Girshick Microsoft Research rbg@microsoft.compaper:Fast R-CNN导读Fast R-CNN在SPPNet的基础再跟进,进一步提升速度和准确率,提出了RoI层代替SPP层,实现了整个物体检测模型大部分网络的end-to-end,下面就来好好学习一下。老套路,现回顾一下: R-CNN ,SPP-netR-CNN和SP...原创 2018-06-15 10:20:58 · 1122 阅读 · 0 评论 -
《Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks》论文阅读之Faster R-CNN
论文阅读:https://arxiv.org/abs/1506.01497源码地址https://github.com/kevinjliang/tf-Faster-RCNN论文翻译:点这里前言Fast-RCNN基本实现端对端(除了proposal阶段外),下一步自然就是要把proposal阶段也用CNN实现(放到GPU上)。这就出现了Faster-RCNN,一个完全end-to-e...原创 2018-06-15 14:04:04 · 784 阅读 · 0 评论 -
论文阅读之《Image Inpainting for Irregular Holes Using Partial Convolutions》
paper:Image Inpainting for Irregular Holes UsingPartial Convolutions 利用部分卷积对不规则孔进行图像修复Nvidia(英伟达)在计算机视觉领域的人工智能技术取得了新突破:Image Inpainting for Irregular Holes Using Partial Convolutions(基于部分卷积层的不规...原创 2018-06-25 14:36:03 · 17462 阅读 · 8 评论 -
多粒度网络(MGN)的结构设计与技术实现
本文是对上篇MGN论文阅读做一个详细的补充,主要补充其结构设计及技术实现细节。文章内容整合来自云从科技资深算法研究员袁余锋老师,通过以下四个方面来讲解本次课题:1、ReID 的定义及技术难点;2、常用数据集与评价指标简介;3、多粒度网络(MGN)的结构设计与技术实现;4、ReID 在行人跟踪中的应用分析与技术展望ReID 是行人智能认知的其中一个研究方向,行人智能认知是人脸识别之后比较重要...转载 2018-06-28 11:44:32 · 14040 阅读 · 0 评论 -
《End-to-end Video-level Representation Learning for Action Recognition》论文解读之DTPP
paper: DTPPcode:DTPP End-to-end Video-level Representation Learning for Action Recognition用于动作识别的端到端视频级表示学习 概要 从帧/剪贴式特征学习到视频层表示构建,动作识别的深度学习方法近年来得到了快速发展。然而,目前的方法受到部分观测训练或没有端到端学习的困扰,或...原创 2018-07-25 11:11:16 · 3359 阅读 · 0 评论 -
《Enhanced Deep Residual Networks for Single Image Super-Resolution》论文阅读之EDSR
导读 韩国首尔大学的研究团队提出用于图像超分辨率任务的新方法,分别是增强深度超分辨率网络 EDSR 和一种新的多尺度深度超分辨率 MDSR,在减小模型大小的同时实现了比当前其他方法更好的性能,分别赢得NTIRE2017超分辨率挑战赛的第一名和第二名。论文阅读点击这里EDSR文章翻译来自:https://mp.weixin.qq.com/s/xpvGz1HVo9eLNDMv9v7vqghttp...原创 2018-05-25 16:01:57 · 18020 阅读 · 4 评论