ICCV2021
文章平均质量分 89
深兰深延AI
这个作者很懒,什么都没留下…
展开
-
2021 ICCV论文分享 | 遮挡边界检测
这篇文章实际上正好解决了我想了好久的多种边界类型判断的问题。创新不大,但是解决问题的角度很好。这篇文章实际上正好解决了我想了好久的多种边界类型判断的问题。而且恰好我目前的数据集是可以做这个的,因此读一下。文章信息作者:Mengyang Pu, Yaping Huang, Qingji Guan, Haibin Ling (BJU & SBU)来源:2021 ICCV原文:https://openaccess.thecvf.com/content/ICCV2021/papers/.原创 2022-02-18 15:47:26 · 3307 阅读 · 0 评论 -
ICCV 2021 Oral | Paint Transformer - 基于笔触预测的快速油画渲染算法
这篇专栏主要介绍我们团队(百度视觉技术部视频理解与编辑组)发表于ICCV 2021上的Oral工作:”Paint Transformer: Feed Forward Neural Painting with Stroke Prediction“。我们提出了首个基于前馈笔触预测来进行快速油画渲染的算法 Paint Transformer,可以快速将一张图片变成一幅充满质感的油画。相关的代码已经基于PaddlePaddle框架开源在PaintTransformer,欢迎大家试用和star。研究背景将一张原创 2022-01-07 19:03:56 · 2399 阅读 · 1 评论 -
ICCV 2021 | 松弛Transformer:实现直接出框的时序动作检测
本文介绍我们组在2021年初公开在arxiv上的时序动作候选框生成工作RTD (Relaxed Transformer Decoders for Direct Action Proposal Generation)。论文链接:https://arxiv.org/abs/2102.01894代码地址:https://link.zhihu.com/?target=https%3A//github.com/MCG-NJU/RTD-Action任务背景伴随在不同社交平台上视频数量的大幅度增加,视频理原创 2021-12-31 18:35:22 · 1985 阅读 · 0 评论 -
ICCV 2021 | MultiSports:面向体育运动场景的细粒度多人时空动作检测数据集
今天介绍一个我们新提出的时空动作检测数据集MultiSports,同时也是DeeperAction比赛的赛道二。首先介绍一下什么是时空动作检测任务(Spatio-Temporal Action Detection):输入一段未剪辑的视频 (untrimmed video),输出视频中人物的动作类别、动作发生的时序区间以及在此区间内的人物框。现有数据集主要分为两大类: 以UCF101-24和JHMDB为代表的密集标注数据集 (25FPS),这类数据集每个视频只有一种动作,大部分视频是单人在做一些..原创 2021-12-29 18:36:01 · 880 阅读 · 0 评论 -
ICCV 2021 Oral | 姿态估计——零基础看懂RLE
最近ICCV 2021上有一项姿态识别领域非常厉害的工作,它就是今天要介绍的残差似然估计(Residual Log-likelihood Estimation)。其工作的核心在于,通过flow方法,估计出模型输出关节的分布概率密度。一旦估计出令人满意的先验分布函数,就能动态优化损失函数loss,从而促进模型的回归训练。从结果上讲,该论文也交出了一份令人满意的答卷:有史以来第一次,回归关节坐标的方法比高斯热图方法取得了更好的效果,而且,回归方法还能保持更快、更轻。(For the first time,原创 2021-12-17 10:30:48 · 1119 阅读 · 1 评论 -
ICCV 2021 | 低质图像化军师:让 IR测评摆脱高清依赖
图像质量评估是一个“古老”而重要的课题,有着广泛的应用和深远的影响。一些非常经典的图像质量评估方法,比如PSNR, SSIM,包括新兴的LPIPS,已经被广泛用来做图像复原任务的衡量指标。但是,这些指标通常需要高质量图像作参考,从而使得其在很多场景下无法适用。本文针对图像复原任务的衡量问题,提出了一种更加具有可行性的图像质量评估方式:通过从低质量图像中提取有用信息,帮助衡量复原图像的质量。这一工作对于无高清图像的图像复原任务(Blind Image Restoration) 提供了一种切实可行的衡量方式原创 2021-12-13 18:02:28 · 2492 阅读 · 0 评论 -
ICCV21论文解读 | AD-NeRF:用于说话人头部合成的音频驱动神经辐射场
作为构建未来虚拟世界诸多应用的主干,如何创造栩栩如生的虚拟数字人,一直是计算机视觉、计算机图形学与多媒体等人工智能相关学科密切关注的重要研究课题。近日,中国科学技术大学联合的卢深视科技有限公司、浙江大学与清华大学共同打造的 AD-NeRF 技术,引发了学界及业界关注。来自中科大张举勇课题组等机构的研究者们在近期大火的神经辐射场(NeRF: Neural Radiance Fields)技术基础上,提出了一种由语音信号直接生成说话人视频的算法。仅需要目标人物几分钟的说话视频,该方法即可实现对该人物超级逼真的形原创 2021-11-30 18:01:10 · 3749 阅读 · 0 评论 -
ICCV 2021 Oral论文解读 | 具有残差对数似然估计的人体姿态回归
新鲜出炉的ICCV Oral,由于我的工作内容是姿态估计相关,因此也在第一时间拜读了一下,以下是一些笔记和过往经验的总结。由于我自身能力有限,文章中存在错误请见谅,欢迎指正。论文地址:https://jeffli.site/res-loglikelihood-regression/resources/ICCV21-RLE.pdf开源地址:https://github.com/Jeff-sjtu/res-loglikelihood-regression这两天抓紧时间看了下作者放出来的代码,发现有些原创 2021-11-23 18:30:09 · 570 阅读 · 0 评论 -
分享 | 无监督视觉目标跟踪
谈谈最近在CVPR2021和ICCV2021上看到的几篇无监督单目标跟踪算法。原创 2021-11-22 18:53:45 · 1962 阅读 · 0 评论 -
冠军方案 | DeepBlueAI 团队拿下首届 LargeFineFoodAI 比赛中的 Large-AI-Food 赛道冠军
日前,两年一度的计算机视觉领域顶级学术会议 ICCV (InternationalConference on Computer Vision) 在加拿大蒙特利尔圆满闭幕。在此期间,与大会同期举行的首届LargeFineFoodAI技术研讨会,由美团视觉智能中心联合中科院计算所、北京智源、巴塞罗那大学在Kaggle竞赛平台上共同主办,会议核心聚焦计算机视觉技术在大规模细粒度食品分析领域的应用。首届 LargeFineFoodAI 比赛分为 Recognition 和 Retrieval 两个赛道,根据研讨原创 2021-10-21 19:02:22 · 186 阅读 · 0 评论 -
冠军方案 | DeepBlueAI 团队包揽 ICCV2021 无人机挑战赛双冠军!
10月11日至10月17日,2021国际计算机视觉大会International Conference on Computer Vision (ICCV)于线上拉开序幕。此次会议,深兰科技DeepBlueAI团队共参加2项比赛4个赛道,分别在VisDrone Object Detection,VisDroneMot,Large-AI-Food三个赛道获得冠军。VisDrone 已成为无人机领域标杆数据集,且业界多篇论文在此数据集基础上研究发表。无人机挑战赛吸引来自全球多家知名团队参与角逐,其中不乏多所高原创 2021-10-21 19:01:15 · 742 阅读 · 1 评论 -
ICCV2021 | DeepBlueAI 团队征战四赛道,一举拿下三项冠军!
10月11日至10月17日,2021国际计算机视觉大会International Conference on Computer Vision (ICCV)于线上拉开序幕。此次会议,深兰科技DeepBlueAI团队共参加2项比赛4个赛道,分别在VisDrone Object Detection,VisDroneMot,Large-AI-Food三个赛道获得冠军。VisDrone 已成为无人机领域标杆数据集,且业界多篇论文在此数据集基础上研究发表。以上两个比赛吸引来自全球多家知名团队参与角逐,其中不乏多所高原创 2021-10-21 18:59:44 · 366 阅读 · 0 评论