计算机视觉学习
文章平均质量分 80
Chris_34
这个作者很懒,什么都没留下…
展开
-
2023-一种无监督目标检测和实例分割方法【Cut and Learn for Unsupervised Object Detection and Instance Segmentation】
与之前的工作相比,CutLER更简单,兼容不同的检测架构,并检测多个对象。利用自监督模型的特性在没有监督的情况下“发现”目标,并将其放大以训练没有任何标签的最先进的检测模型。CutLER 首先使用作者提出的 MaskCut 方法为图像中的多个对象生成粗蒙版mask,然后使用设计的鲁棒损失函数学习这些掩模上的检测器。目标检测和分割依赖海量数据的标注,模型训练耗时最大的是数据采集和标注过程,无监督学习在目标检测和分割中的应用较少。原创 2023-01-29 16:56:50 · 3056 阅读 · 2 评论 -
CaDDN模型理解
基于摄像机图像进行3D视觉任务的方法已经有了很多不错的工作。本文中的CaDDN网络(Categotical Depth Distribution Network),通过为每个像素预测出深度分布,将图像特征(2D特征)投影到3D空间中适当的深度区间。然后使用鸟瞰图(BEV)投影和单级检测器产生最终输出检测结果,评测效果提升明显。CaDDN PaperCaDDN 源码CaDDN模型理解单目3D检测通常会生成中间的特征表示形式,主要可以划分为以下三类:直接法:结合2D图像平面和3D空间的几何关系原创 2021-12-21 14:37:28 · 3826 阅读 · 7 评论 -
Pointnet语义分割任务S3DIS数据集上的注意点
前言Pointnet的网络结构和源码解释,已在之前写了次总结,本次主要针对论文中的数据集以.h5为TensorFlow的输入格式进行解释,记录如何将制作H5文件,以提供给TensorFlow,PyTorch框架中进行训练。首先,Pointnet一文中针对三个不同的任务使用到了三个数据集,分别为:点云分类(3D Object Classification)——ModelNet40,下载命令在...原创 2020-04-09 21:44:56 · 21023 阅读 · 50 评论 -
点云的球面投影理解
前言球面投影或正视图投影是将3D点云数据表示为2D图像数据的一种方式,因此从本质上讲,它还充当降维方法。球形投影方法正越来越多地用于处理点云深度学习解决方案中。应用最广泛的领域是对点云中对象进行分类和分割任务,这个投影方法在多个工作中使用,例如:PointSeg,SqueezeSeg, SalsaNet等,以及在上一篇总结到的最新的语义分割网络3D-MiniNet也用到了球面投影。将点云表示为...原创 2020-04-02 06:27:19 · 17818 阅读 · 12 评论 -
3D-MiniNet实时LIDAR点云语义分割的深度学习方法整理
3D-MiniNet: 从点云中学习2D表示以实现快速有效的3D LIDAR语义分割西班牙Zaragoza大学的研究人员提出的最新3D点云语义分割的深度学习方法,提出新的滑动框搜索球形投影后的“像素点”,使用改进的MiniNetV2发布的两种网络设置在SemanticKITTI和KITTI数据集上刷新了成绩,成为新的SoTA。源码可能会在四月份开源,作者提到实现部分将会参照RangeNet++和...原创 2020-04-01 22:15:47 · 4581 阅读 · 1 评论 -
结合代码理解Pointnet++网络结构
Pointnet++个人笔记前言Pointnet提取的全局特征能够很好地完成分类任务,由于网络将所有的点最大池化为了一个全局特征,因此局部点与点之间的联系并没有被网络学习到,导致网络的输出缺乏点云的局部结构特征,因此PointNet对于场景的分割效果十分一般。在点云分类和物体的Part Segmentation中,这样的问题可以通过中心化物体的坐标轴部分地解决,但在场景分割中很难去解决。原文...原创 2020-03-26 05:38:34 · 15581 阅读 · 4 评论 -
PyTorch1.4.0-torchvision参考(一)
torchvision参考简介对于使用pytorch进行CV深度学习而言,torchvision工具包确实很香,可以很方便的进行模型搭建或迁移学习的工作,还支持对视频的操作。Pytorch官方文档做了相当多的工作,对于这一部分的实例演示也很丰富,如果你恰巧学会如何正常使用google云盘,并且能够正常打开colab的话,那还可以更香地体验notebook形式提供的所有用例。PyTorch1....原创 2020-03-23 07:22:09 · 9558 阅读 · 0 评论 -
Pointnet网络结构与代码解读
Pointnet网络个人笔记Pointnet开创性地将深度学习直接用于三维点云任务。由于点云数据的无序性,无法直接对原始点云使用卷积等操作。Pointnet提出对称函数来解决点的无序性问题,设计了能够进行分类和分割任务的网络结构,本文结合源码与个人的理解对于T-net网络和对称函数进行分析。点的无序性针对点的无序性问题实际上是文章提出了三个方案:对于无序点集进行排序(Pointcnn...原创 2020-03-18 18:31:41 · 23431 阅读 · 13 评论 -
语义分割最新指南2019版
之前出现的深度学习语义分割指南2017版(A 2017 Guide to Semantic Segmentation with Deep Learning ),作者总结了当年各个具有代表性的语义分割算法与相关贡献。今年Namespace Africa 数据科学家Derrick Mwiti 对该领域的再一次梳理(原文链接),希望对大家有帮助。语义分割指的是将图像中的每一个像素关联到一个类别标签上...原创 2019-10-10 02:42:08 · 13916 阅读 · 0 评论