计算机视觉
文章平均质量分 89
陈同学_alex
这个作者很懒,什么都没留下…
展开
-
深度估计的地面假设
则图像中每个像素对应的3D点,等于从相机光心发射的、通过该像素的射线与地面的交点。求解该交点,并将其投影到相机坐标系,即可得到每个像素距离地面的深度。平面外某条射线的起点。假设已知相机到地面的位姿。求:射线 和平面的交点。已知:空间平面上的点。原创 2023-09-13 23:08:43 · 280 阅读 · 0 评论 -
MVSNet,CVP-MVSNet论文阅读和代码解析
提出一种基于cost volume的神经网络,用于多视图图像的深度推断。我们证明了以一种coarse-to-fine的方式构建cost volume金字塔,而不是以固定分辨率构建cost volume,可以得到一个紧凑、轻量级的网络,并允许推断高分辨率深度图,以获得更好的重建结果。为此,首先以图像的最粗分辨率在整个深度范围内对前平行平面(fronto-parallel planes)进行均匀采样,以此为基础构建cost volume。然后,给定当前深度估计,我们在像素深度残差上迭代构建新的cost volu原创 2023-09-11 12:43:14 · 451 阅读 · 1 评论 -
光流估计算法RAFT的论文和代码阅读
RAFT论文和代码阅读RAFT: Recurrent All-Pairs Field Transforms for Optical FlowZachary Teed and Jia DengECCV2020 best paper摘要We introduce Recurrent All-Pairs Field Transforms (RAFT), a new deep network architecture for optical flow. RAFT extracts per-pixel fe原创 2022-04-08 22:12:00 · 4076 阅读 · 1 评论 -
PointNet++论文和代码阅读
PointNet++: Deep Hierarchical Feature Learning on Point Sets in a Metric SpaceCharles R. Qi Li Yi Hao Su Leonidas J. GuibasStanford UniversityAbstractFew prior works study deep learning on point sets. PointNet is a pioneer in this direction. However, b原创 2022-04-03 19:28:27 · 4253 阅读 · 0 评论 -
基于FPGA的车牌识别系统
程序基于Xilinx公司的Pynq-Z2开发板,使用opencv库完成车牌识别.项目背景和设计目的•车牌识别系统是计算机视频图像识别技术在车辆牌照识别中的一种应用,在高速公路、停车场、小区、道路等环境下有着广泛的应用。•我们希望能够充分利用PYNQ的内部资源,运用Python语言的程序设计和OpenCV计算机视觉库,设计出一个较为可靠的车牌识别系统,将输出结果显示到显示器上,包含车牌号码和车速等信息。•对于停车场门口或收费站等应用场景,本系统还可以直...原创 2021-08-21 10:57:09 · 7993 阅读 · 1 评论 -
YOLACT论文笔记
YOLACT: Real-time Instance Segmentation.Daniel Bolya,Chong Zhou,Fanyi Xiao,Yong,Jae Lee.来自加州大学戴维斯分校.摘要本文提出一个全卷积的、实时实例分割模型:YOLACT,使用Titan Xp在MS COCO上以33.5 fps达到29.8 mAP,可以说是第一个达到达到实时的现代的实例分割模型。这还是在单个GPU上训练就得到的结果。YOLACT将实例分割分成两个并行的子任务:(1)生成一组原型掩码(...原创 2021-08-20 10:57:37 · 1869 阅读 · 2 评论 -
SOLO论文笔记
论文:Xinlong Wang,Tao Kong,Chunhua Shen1,Yuning Jiang,Lei Li.SOLO: Segmenting Objects by Locations.阿莱德大学和字节跳动。摘要这篇论文提出了一个新的实例分割模型SOLO。与语义分割相比,实例分割任务由于实例数量的不确定,因此更加困难。为了预测实例掩码,主流方法要么“detect-then-segment”,比如Mask R-CNN;要么先预测每个像素的类别,再使用聚类技术划分实例。本文从...原创 2021-08-20 10:50:21 · 1244 阅读 · 0 评论 -
RetinaNet和Focal Loss论文笔记
论文:Focal Loss for Dense Object Detection.Tsung-Yi Lin Priya Goyal Ross Girshick Kaiming He Piotr Dollar.Facebook AI Research (FAIR)摘要当前最精确的目标检测算法是two-stage的,这类方法的的分类器处理的包围框是稀疏的。而单阶段目标检测器处理的是规则的、稠密的的包围框上,因此更快、更简单,但是精度不及两阶段目标检测算法。本文对这个现象进行了研究,认为...原创 2021-08-20 10:48:27 · 610 阅读 · 0 评论 -
终生学习(增量学习)概述
概念终生学习(Life Long Learning,LLL),又称为Continuous Learning、Never Ending Learning、Incremental Learning,就是机器可以不断学习新知识,而不会忘记学过的知识。LLL需要解决三个问题:Knowledge Retention、Knowledge Transfer、Model Expansion。本文内容总结自李宏毅的PPT。1.Knowledge Retention问题提出Knowledge...原创 2021-08-20 10:46:38 · 2584 阅读 · 0 评论 -
MobileNet论文笔记
论文:Andrew G. Howard,Menglong Zhu,Bo Chen,Dmitry Kalenichenko,Weijun Wang,Tobias Weyand,Marco Andreetto,Hartwig Adam.Google Inc.MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications.摘要本文提出了一个轻量级的骨干网络:MobileNet,可应用在移...原创 2021-08-20 10:42:06 · 888 阅读 · 0 评论 -
Xception论文笔记
论文:Franc¸ois Chollet.Xception: Deep Learning with Depthwise Separable Convolutions引言本文将Inception模块解释为标准卷积和深度可分离卷积的中间步骤。此时深度可分离卷积可以看作一个具有最大分枝数的Inception模块。因此本文提出了一种新的卷积神经网络结构,其中Inception模块使用深度可分离卷积替代,称为Xception。在ImageNet数据集上,Xception性能轻微胜过Inceptio...原创 2021-08-20 10:39:50 · 868 阅读 · 0 评论 -
Inception-v4,Inception-ResNet论文笔记
论文:Christian Szegedy,Sergey Ioffe,Vincent Vanhoucke,Alex Alemi.Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning摘要非常深的卷积神经网络已经称为最近几年CV任务中的核心,比如Inception架构可以低计算代价实现高精度的特征抽取。本文在Inception-v3的基础上提出了Inception-v4,并将Ince...原创 2021-08-20 10:38:15 · 1014 阅读 · 0 评论 -
DenseNet论文笔记
论文:Gao Huang, Zhuang Liu, Laurens van der Maaten, Kilian Q. Weinberger.Densely Connected Convolutional Networks.CVPR 2017摘要最近的研究表明,如果CNNs在靠近输入层和接近输出层之间使用较短的连接,那么可以更深入、更准确、更有效地进行训练网络。由此,本文提出了稠密卷积网络(DenseNet),以前馈的方式各层相互连接。传统的L层CNNs有L个连接,每层与它前一层和后一...原创 2021-08-20 10:35:31 · 412 阅读 · 0 评论 -
PANet论文笔记
论文:Path Aggregation Network for Instance Segmentation.Shu Liu,Lu Qi,Haifang Qin,Jianping Shi,Jiaya Jia.摘要在NN中让信息自由流动很重要,本文提出了PANet(Path Aggregation Network)用于在proposal-based的实例分割框架中提高了信息流动的能力。具体地说,本文通过自底向上的路径拓展来增强整体的特征层次,从而缩短了底层和顶层之间的信息传播距离。由此,...原创 2021-08-20 10:26:26 · 1746 阅读 · 0 评论 -
CSPNet论文笔记
论文:CSPNET: A NEW BACKBONE THAT CAN ENHANCE LEARNING CAPABILITY OF CNN. Chien-Yao Wang,Hong-Yuan Mark Liao,I-Hau Yeh...摘要NN在CV领域取得了很大的成功,然而这个成功依赖于巨大计算量,不利于在移动设备上部署。本文提出了Cross Stage Partial Network(CSPNet)来解决这个问题。这里认为当前深度神经网络计算量大的原因是网络优化时重复计算梯度信息,...原创 2021-08-20 10:24:59 · 975 阅读 · 0 评论 -
CBAM论文笔记
论文:CBAM: Convolutional Block Attention Module. Sanghyun Woo, Jongchan Park, Joon-Young Lee, and In So Kweon摘要本文提出了Convolutional Block Attention Module(CBAM),一个简单而有效的前馈卷积神经网络注意力模块。给定一个特征图,CBAM可以沿着通道和空间维度依次得到注意力特征图,然后将注意力特征图相乘到输入特征图中进行自适应特征细化。由于CBA...原创 2021-08-20 10:23:03 · 1824 阅读 · 1 评论 -
CBN论文笔记
论文:Cross-Iteration Batch Normalization.Zhuliang Yao,Yue Cao,Shuxin Zheng,Gao Huang,Stephen Lin摘要当mini-batch的大小设置的比较小时,BN的作用大大减小。因为太少的样本估计的统计特征无法代表整个数据集的统计特征。为了解决这个问题,本文提出了Cross-Iteration Batch Normalization(CBN),可以联合最近几次迭代的样本来提高估计的质量。这其中的难点在于由于每...原创 2021-08-20 10:20:32 · 333 阅读 · 0 评论 -
YOLOv4论文笔记
论文:YOLOv4: Optimal Speed and Accuracy of Object Detection.Alexey Bochkovskiy,Chien-Yao Wang,Hong-Yuan Mark Liao摘要现在有非常多的tricks都说可以提高CNNs的精度,这些tricks需要在大型数据集上对这些trick的组合进行实际测试,并对结果进行理论论证。有些trick只能在某些模型或某些问题上运行的很好;而有些比如BN或残差连接则可以被广泛应用到各种任务和模型上。本文认...原创 2021-08-19 13:36:07 · 551 阅读 · 0 评论 -
超分辨率综述
概念:图像超分辨率(image super resolution, SR)是计算机视觉和图像处理中一类重要的图像处理技术,是指从低分辨率(low resolution, LR)图像中恢复高分辨率(high resolution, HR)图像的过程。它有广泛的现实世界的应用,如医学成像,安防等。除了提高图像感知质量外,它还有助于提高其他计算机视觉任务。总的来说,这个问题是非常具有挑战性的,而且是一个ill-posed问题,有多个HR图像对应到单个LR图像。引言:近年来,随着深度学习技术的.原创 2021-08-19 13:11:46 · 8805 阅读 · 1 评论 -
SRNTT论文阅读
论文:Image Super-Resolution by Neural Texture Transfer .Zhifei Zhang,Zhaowen Wang,Zhe Lin,Hairong Qi摘要:由于低分辨率(LR)图像存在大量的信息丢失,继续提高单图像超分辨率(SISR)的性能已越来越困难。另一方面,当参考(Ref)图像与LR输入的内容相似时,基于参考图像的超分辨率(RefSR)在恢复高分辨率(HR)细节方面是promising。但是当Ref图像与ground truth不太相似时,Re..原创 2021-08-19 13:03:38 · 1455 阅读 · 0 评论 -
RFB论文阅读
论文:Receptive Field Block Net for Accurate and FastObject Detection.Songtao Liu, Di Huang,YunhongWang摘要目前性能最好的物体检测器依赖于深度CNN骨干,如ResNet-101和Inception,它们得益于其强大的特征表示,但却承受着高昂的计算成本。相反,一些基于模型的轻量化检测器实现了实时处理,但其准确性经常受到批评。在本文中,我们探索了一种替代方法,通过使用hand-crafted的机制...原创 2021-08-19 13:01:10 · 1386 阅读 · 0 评论 -
EifficientDet论文笔记
论文:EfficientDet: Scalable and Efficient Object Detection.Mingxing Tan Ruoming Pang Quoc V. Le摘要模型效率在计算机视觉中变得越来越重要。本文系统地研究了用于目标检测的神经网络体系结构的设计选择,并提出了提高效率的几个关键优化。首先,本文提出了一种加权双向特征金字塔网络(BiFPN),该网络能够实现简单、快速的多尺度特征融合;其次,本文提出了一种复合缩放方法,对所有骨干网络、特征网络和边界框/类别预..原创 2021-08-19 12:59:35 · 628 阅读 · 0 评论 -
ASFF论文笔记
论文:LearningSpatialFusionforSingle-ShotObjectDetection. Songtao Liu,Di Huang,Yunhong Wang摘要金字塔特征表示是解决目标检测中尺度变化问题的常用方法。然而,不同特征尺度上的不一致性是基于特征金字塔的单阶段检测器的主要局限性。在这项工作中,我们提出了一种新的数据驱动的金字塔特征融合策略,即自适应空间特征融合( adaptively spatial feature fusion,ASFF)。它通过学习...原创 2021-08-19 12:55:27 · 2220 阅读 · 0 评论 -
M2Det论文笔记
论文:M2Det: A Single-Shot Object DetectorBased on Multi-Level Feature Pyramid Network.Qijie Zhao, Tao Sheng, Yongtao Wang,Zhi Tang,Ying Chen,Ling Cai,Haibin Ling摘要特征金字塔被最先进的单阶段目标检测器(例如DSSD, RetinaNet, RefineDet)和两阶段目标检测器(例如Mask RCNN, DetNet)广泛利用,以...原创 2021-08-19 12:53:31 · 330 阅读 · 0 评论 -
Soft NMS论文笔记
论文:Improving Object Detection With One Line of Code. Navaneeth Bodla*, Bharat Singh*, Rama Chellappa, Larry S. Davis摘要NMS是目标检测管道中不可分割的一部分。首先,它根据置信度对所有检测的边界框进行排序。选中最大置信度的框M,抑制(剔除)其它与M有很大(预定义阈值)重叠的框。这个过程递归地应用到其余的框上。如果一个目标处于预定义的重叠阈值内(即重叠大于该阈值),就会导致漏检。换句原创 2021-08-19 12:50:18 · 1216 阅读 · 0 评论 -
DIoU Loss论文阅读
论文:Distance-IoU Loss: Faster and Better Learning for Bounding Box Regression. Zhao hui Zheng1,Ping Wang1 , Wei Liu2 , Jinze Li3 , Rongguang Ye1 , Dongwei Ren*2摘要边界框回归是目标检测中的关键步骤。当前方法采用ln-norm loss作为边界框回归的损失,但是它不是为评估指标(IoU)量身定做的。最近适合IoU评估指标的IoU los.原创 2021-08-19 12:48:30 · 2287 阅读 · 0 评论 -
DropBlock论文笔记
论文:DropBlock: A regularization method forconvolutional networks.Golnaz Ghiasi,Tsung-Yi Lin,Quoc V. Le摘要当深度神经网络被过度参数化,并使用大量的噪声和正则化(如权重衰减和Dropout)进行训练时,它们通常能很好地工作。尽管dropout作为全连接层的正则化技术被广泛使用,但它对于卷积层的效果往往较差。对于卷积层来说,dropout失败的原因可能是由于卷积层中的激活单元是空间相关的,所以即使..原创 2021-08-19 12:44:31 · 554 阅读 · 0 评论 -
DropConnect论文笔记
论文:Regularization of Neural Networks using DropConnect. Li Wan,Matthew Zeiler,Sixin Zhang,Yann LeCun,Rob Fergus摘要我们引入了DropConnect,这是Dropout的一个推广,用于正则化神经网络中的大型全连接层。当使用Dropout进行训练时,在每一层中将随机选取的激活子集设为零。DropConnect将网络中随机选择的权重子集设置为零。因此,每个单元接收来自前一层单元的随机子.原创 2021-08-19 12:41:48 · 993 阅读 · 0 评论 -
PointNet论文笔记
PointNet: Deep Learning on Point Sets for 3D Classification and Segmentation.Charles R. Qi* Hao Su* Kaichun Mo Leonidas J. Guibas.斯坦福大学.CVPR 2017目录摘要1.引言2.相关工作2.1.Point Cloud Features:2.2.Deep Learning on 3D Data:2.3.Deep Learning ...原创 2021-08-19 12:28:25 · 546 阅读 · 0 评论 -
LSTD论文笔记
LSTD: A Low-Shot Transfer Detector for Object Detection.H Chen,Y Wang,G Wang,Y Qiao摘要目标检测的最新进展主要是由大规模检测基准的深度学习驱动的。然而,完全标注的训练集受限于目标检测任务,这可能会恶化深度检测器的性能。为了解决这一挑战,本文提出了一种新的low-shot迁移检测器(LSTD),其中利用丰富的源域(source-domain)的知识,在很少的训练样本下构造有效的目标域(target-doma...原创 2021-08-19 12:24:02 · 750 阅读 · 0 评论 -
最详细的YOLOv3论文笔记
个人博客:http://www.chenjianqu.com/原文链接:http://www.chenjianqu.com/show-117.html论文:YOLOv3: An Incremental Improvement.Joseph Redmon,Ali Farhadi.from 华盛顿大学摘要本文对YOLO做了一些小改进,还提出了新的backbone:Dark...原创 2020-04-13 18:44:57 · 1419 阅读 · 0 评论 -
最详细的YOLOv2论文笔记
个人博客:http://www.chenjianqu.com/原文链接:http://www.chenjianqu.com/show-116.html论文:YOLO9000:Better, Faster, Stronger.Joseph Redmon, Ali Farhadi.from 华盛顿大学,艾伦AI研究所摘要本文提出YOLO9000,一个SOTA、实时的目标检...原创 2020-04-13 18:43:49 · 654 阅读 · 0 评论 -
UPSNet论文笔记
个人博客:http://www.chenjianqu.com/原文链接:http://www.chenjianqu.com/show-115.html论文:Yuwen Xiong, Renjie Liao, Hengshuang Zhao, Rui Hu, Min Bai, Ersin Yumer, Raquel Urtasun.UPSNet: A Unified Panoptic Se...原创 2020-04-13 18:41:48 · 1093 阅读 · 0 评论 -
Deformable CNNs论文笔记
个人博客:http://www.chenjianqu.com/原文链接:http://www.chenjianqu.com/show-114.html论文:17 Mar 2017.Jifeng Dai, Haozhi Qi, Yuwen Xiong, Yi Li, Guodong Zhang, Han Hu, Yichen Wei.MSRA.Deformable Convolutional...原创 2020-04-13 18:39:39 · 611 阅读 · 0 评论 -
Panoptic Segmentation论文笔记
个人博客:http://www.chenjianqu.com/原文链接:http://www.chenjianqu.com/show-113.html论文:Alexander Kirillov,Kaiming He,Ross Girshick,Carsten Rother,Piotr Dollar.Facebook AI Research (FAIR),Heidelberg U...原创 2020-04-13 18:37:50 · 1574 阅读 · 0 评论 -
最详细的Mask R-CNN论文笔记
个人博客:http://www.chenjianqu.com/原文链接:http://www.chenjianqu.com/show-111.html论文:Kaiming He Georgia Gkioxari Piotr Dollar Ross Girshick.Facebook AI Research (FAIR).Mask R-CNN.20 Mar 2017素质三连1.论文贡...原创 2020-04-13 18:33:50 · 1849 阅读 · 1 评论 -
最详细的FPN论文笔记
个人博客:http://www.chenjianqu.com/原文链接:http://www.chenjianqu.com/show-110.html论文:Tsung-Yi Lin, Piotr Dollar, Ross Girshick,Kaiming He, Bharath Hariharan, and Serge Belongie. Facebook AI Research (FAI...原创 2020-04-13 18:31:17 · 1102 阅读 · 0 评论 -
基于Tkinter和百度Aip的人体关键点检测
个人博客:http://www.chenjianqu.com/原文链接:http://www.chenjianqu.com/show-104.html最近某些项目需要用到人体姿势识别。当前有很多著名的人体识别的开源项目,比如CMU的OpenPose,上交的AlphaPose,效果都很好。我昨天试着安装一下AlphaPose,配环境配了一天,终于可以运行Demo的时候,显存溢出。。。因此我换...原创 2020-04-13 18:22:08 · 1222 阅读 · 0 评论 -
OpenCV-Mat笔记
Mat https://docs.opencv.org/master/d3/d63/classcv_1_1Mat.html#af2d2652e552d7de635988f18a84b53e5 Mat类型是opencv2.0后的类型,使用此类型无需进行内存管理.Mat包含2个数据部分:矩阵和矩阵头。矩阵头包含matrix大小,存储方法,matrix存储地址等,矩阵头的内存大小固定. Ope...原创 2020-04-13 18:11:28 · 306 阅读 · 0 评论 -
OpenCV2和OpenCV3兼容安装
个人博客:http://www.chenjianqu.com/原文链接:http://www.chenjianqu.com/show-79.html最近重新开始使用opencv-cpp,有些项目需要的是OpenCV2,有些需要多是OpenCV3,这两个版本的如何共存是个值得研究多问题。这里记录一次OpenCV3和2的安装过程。安装OpenCV31.源码下载我这里使用...原创 2020-03-20 22:30:54 · 649 阅读 · 1 评论