前沿
文章平均质量分 70
一个菜鸟的奋斗
这个作者很懒,什么都没留下…
展开
-
V3Det大规模词汇视觉检测数据集与LaRS海上全景障碍物检测数据集
V3Det与LaRS是ICCV2023上发表的数据集工作,规模都比较大,后续有可能会用到,因此记录下来。原创 2023-10-26 17:31:36 · 930 阅读 · 0 评论 -
手把手教你通过PaddleHub快速实现输入中/英文本生成图像(Stable Diffusion)
近来,基于Diffusion的文图生成模型比较火,用户输入一句话,模型就可以生成一副对应的图像,还是很有意思的。本文记录了通过PaddleHub快速实现上述任务的过程,以供参考。PaddleHub底层依赖于百度自研的开源框架PaddlePaddle,可以根据官方提供的方式来快速安装,目前文档还是挺全面的。PaddleHub开源了较为丰富的预训练模型,涵盖大模型、CV、NLP、Audio、Video、工业应用主流六大品类的 360+ 预训练模型。原创 2022-09-15 16:43:13 · 4686 阅读 · 8 评论 -
PartImageNet物体部件分割(Semantic Part Segmentation)数据集介绍
PartImageNet是发表在ECCV2022的论文,主要是提出了一个当前最大、最全的物体part数据集。数据集下载链接在GitHub上已放出,可以下载。原创 2022-07-29 17:33:45 · 1359 阅读 · 0 评论 -
2022下半年CV计算机视觉领域可投稿国际会议列表(含录用率)
本文梳理了2022下半年计算机视觉领域可以投稿的一些国际会议,根据截稿时间由近到远排序,会议举办时间都在2023年。下表会议不一定全面,供参考。原创 2022-07-26 17:52:37 · 9002 阅读 · 6 评论 -
文本OCR相关资料收集
文本相关的图像处理是目前应用比较多的一个方向,平时看了一些资料,整理收集链接如下,以备后用。整体感觉,百度的PaddleOCR算是国内OCR开源方面做的比较好的了。论文方面,每年顶会有一些文章出来,可以查看以把握前沿的技术。Search for document image | Papers With CodePaddleOCR: Awesome multilingual OCR toolkits based on PaddlePaddle (practical ultra lightweight OCR原创 2022-06-13 17:59:11 · 441 阅读 · 0 评论 -
CVPR2022目标检测方向论文
[1]SIGMA: Semantic-complete Graph Matching for Domain Adaptive Object Detectionpaper:https://arxiv.org/pdf/2203.06398code:https://github.com/CityU-AIM-Group/SIGMA[2]Democracy Does Matter: Comprehensive Feature Mining for Co-Salient Object Detecti...原创 2022-03-15 18:00:46 · 9812 阅读 · 0 评论 -
手把手教你快速上手人体姿态估计(MMPose)
最近在研究如何快速实现图像中人体姿态的估计,也就是常见的pose estimation任务。花了些时间,实际对比了AlphaPose、BlazePose和MMPose。BlazePose主要为移动端设计,AlphaPose安装配置比较麻烦,MMPose用起来更为方便,而且支持的模型数量也很多。因此,最终选定MMPose作为人体姿态估计的算法库。以下实测环境为Ubuntu20.04系统。MMPose源码:https://github.com/open-mmlab/mmposeMMPose官方文档:原创 2021-11-22 18:30:49 · 11330 阅读 · 11 评论 -
ICCV2021目标检测方向论文
研究一下ICCV2021目标检测方向的论文。[1]GraphFPN: Graph Feature Pyramid Network for Object Detectionpaper:https://arxiv.org/abs/2108.00580code: TBD[2]SimROD: A Simple Adaptation Method for Robust Object Detectionpaper:https://arxiv.org/abs/2107.13389code:...原创 2021-08-03 11:34:14 · 3472 阅读 · 2 评论 -
Towards Open World Object Detection - CVPR2021 Oral(开放世界中的目标检测)
仔细研读了“Towards Open World Object Detection”,这是今年CVPR的一篇Oral论文,算是挖了一个比较有意思的坑,开放世界中的目标检测。总体看来,论文所提出的ORE模型能够完成这个任务,不过还有很多可以改进的点,值得进一步研究。paper:https://arxiv.org/abs/2103.02603code:https://github.com/JosephKJ/OWOD1. 什么是开放世界中的目标检测呢?作者定义的这个新问题,满足两个特征:..原创 2021-03-16 11:01:59 · 6973 阅读 · 6 评论 -
CVPR2021目标检测方向论文
CVPR2021录取结果刚出来,不过离全部的paper list还有一段时间,接下来应该会有人提前将论文贴出来,准备陆续收集相关的论文研究起来。[1]Distilling Object Detectors via Decoupled Features[2]Positive-Unlabeled Data Purification in the Wild for Object Detection[3]UP-DETR: Unsupervised Pre-training for Object D...原创 2021-03-02 09:53:30 · 7241 阅读 · 4 评论 -
CVPR2020目标检测方向论文
CVPR 2020的paper list已经放出来了,链接如下:http://cvpr2020.thecvf.com/program/main-conference原创 2020-03-20 11:16:28 · 6477 阅读 · 2 评论 -
简单聊聊PointRend: Image Segmentation as Rendering将图像分割视作渲染问题
刚刚Kaiming He团队又release了一篇文章,PointRend: Image Segmentation as Rendering,提出一种非常新颖的图像分割方法。受到经典计算机图形学中渲染方法的启发,分析了密集像素预测中遇到的过采样和欠采样问题,选择将图像分割看作渲染问题这个独特的视角来解决。https://arxiv.org/pdf/1912.08193.pdf论文还没有仔细...原创 2019-12-19 16:20:02 · 1056 阅读 · 0 评论