计算机视觉
文章平均质量分 93
整理从视频内容中提取语义信息的相关技术,如个体行为识别、群体行为分析、异常行为检测。从图像提取语义描述的相关技术,text-to-image、image caption、VQA等等。
虾米小馄饨
算法工程师
展开
-
OpenCV 中的矩(moments)和 Hu不变矩(HuMoments)
图像矩通常用于分析、描述分割后的形状。原创 2022-01-19 21:43:22 · 7402 阅读 · 0 评论 -
用python写一个图像文字识别OCR工具
含文本区域检测+文字识别。原创 2021-12-07 21:58:08 · 32330 阅读 · 61 评论 -
图解 RoIAlign 以及在 PyTorch 中的使用(含代码示例)
RoIAlign其实就是“精确版”的RoI Pooling。用于将任意尺寸的特征图,都转换为具有固定尺寸的小特征图。原创 2021-11-08 22:02:27 · 17781 阅读 · 10 评论 -
Image Caption 2021最新整理:数据集 / 文献 / 代码
Microsoft COCO Captions、SBU Captions、Conceptual Captions (CC) dataset、TextCaps、VizWiz-Captions、Localized Narratives、Nocaps等原创 2021-09-22 21:53:37 · 21439 阅读 · 22 评论 -
OpenCV中的「透视变换 / 投影变换 / 单应性」—cv.warpPerspective、cv.findHomography
透视变换通常被用于从特定角度观察三维平面的计算方法(非垂直观测),在三维视觉领域具有广泛的应用。原创 2021-09-15 20:50:56 · 9327 阅读 · 8 评论 -
计算机视觉哪个方向最火?来看这篇综述《中国图像工程:2020》
图像相关的研究方向具体有哪些类别?哪些研究方向现在比较火?比较有前景?不知道用什么关键词能查到想找的文献?图像相关技术在哪些领域应用比较多?如果你想了解这些问题,可以看看这几篇综述文章,或许能有所启发。原创 2021-06-24 21:55:40 · 1546 阅读 · 16 评论 -
样本不均衡、长尾分布问题的方法整理(文献+代码)
分类任务中的样本不平衡问题,主要是不同类别之间样本数量的不平衡,导致分类器倾向于样本较多的类别,在样本较少的类别上性能较差。样本不均衡问题常常出现在呈长尾分布的数据中(long tailed data),如下图所示[^longtail]。现实生活中很多数据都类似长尾分布,头部数据类别数据量多,尾部类别数据量少。由于尾部类别(tail classes)数据量少,模型学习到的表征信息不够丰富,导致模型并不能很好的表达尾部类。原创 2021-06-22 17:52:11 · 8702 阅读 · 19 评论 -
基于视觉的烟雾/火焰检测数据集整理(检测、识别、分割)
2.1 视觉火灾预警的背景参考文献:夏雪, 袁非牛, 章琳, et al. 从传统到深度:视觉烟雾识别、检测与分割[J]. 中国图象图形学报, 2019(10).基于传感器组的传统监控系统比较适用于较小空间, 随着视觉技术的发展, 视觉火灾预警系统能够有效地对森林区域进行远距离监控[5] 。2018 年国家森防已将“进一步提高森林防火工作现代化水平, 适应新时代发展要求”作为火灾启示的总结之一[6]。基于此, 本文主要关注基于人工智能视觉技术的森林火灾监控。森林火灾初期通常会产生大量烟雾, 这一现原创 2021-04-09 15:09:00 · 29268 阅读 · 104 评论 -
视频转图片序列、图像序列转视频等处理(mmcv vs. opencv)
文章目录mmcv简介视频常用代码片段加载视频读取视频帧视频转图像序列1. `mmcv`版本2. `opencv`版本(大部分工程里使用)图像序列转视频`mmcv`版本剪辑视频片段拼接视频修改视频尺寸/分辨率mmcv简介mmcv是商汤科技用于计算机视觉研究的基础python库,API比opencv更简洁,很适合深度学习项目的图像、视频预处理。安装mmcv依赖库:pip install mmcv与opencv相比,mmcv.VideoReader提供通过序列访问视频帧的API,VideoReader原创 2021-02-25 19:28:40 · 3049 阅读 · 1 评论 -
视频动作识别、行为识别、时空动作检测数据集整理(持续更新)
动作、行为、事件 在计算机视觉的相关研究中,人体的动作、行为识别是一个基础研究问题。但目前识别、检测人类的动作/行为仍然是一个巨大的挑战。这里整理下当前相关的细分任务、数据集和开源代码(持续更新中)。原创 2021-02-22 23:04:00 · 25306 阅读 · 16 评论