论文
文章平均质量分 75
Good@dz
烟火向星辰,所愿皆成真
展开
-
RESA车道线检测算法---计算量和参数量的计算
RESA车道线检测算法原创 2022-12-07 23:36:36 · 795 阅读 · 0 评论 -
scnn复现
源代码:https://github.com/Tramac/Fast-SCNN-pytorch参考Ultra-Fast-Lane-Detection 复现在 Tusimple 上训练的模型可以在这里下载。它的配置文件在exp0.3.修改config.py4.训练与测试训练代码测试代码5.修改test_tusimple.py为了输出模型的计算量和参数量,将test_tusimple.py修改为以下,再运行第4点的测试代码......原创 2022-06-24 20:12:36 · 788 阅读 · 1 评论 -
CLRNet: Cross Layer Refinement Network for Lane Detection
论文下载地址:https://arxiv.org/pdf/2203.10350.pdf代码下载地址:https://github.com/Turoad/CLRNet车道线是智能车辆视觉导航系统的关键。自然,车道线是一种具有高级语义的交通标志,但它具有特定的局部模式,需要详细的底层特征才能准确定位。使用不同的特征级别对于准确的车道检测非常重要,但这方面的研究仍然不足。在这项工作中,我们提出了跨层细化网络(CLRNet),旨在充分利用车道检测中的高级和低级特征。特别是,它首先检测具有高级语义特征的车道,然后基原创 2022-06-24 15:33:08 · 1439 阅读 · 0 评论 -
resa复现
源代码:https://github.com/ZJULearning/resa1.数据集准备参考Ultra-Fast-Lane-Detection 复现2. 环境搭建conda create -n resa python=3.8 -yconda activate resa# Install pytorch firstly, the cudatoolkit version should be same in your system. (you can also use pip to install原创 2022-05-01 10:37:58 · 991 阅读 · 17 评论 -
polylane 复现
源代码:https://github.com/lucastabelini/PolyLaneNet1.数据集准备参考Ultra-Fast-Lane-Detection 复现原创 2022-04-30 22:15:25 · 488 阅读 · 0 评论 -
Ultra-Fast-Lane-Detection 复现
源码地址:https://github.com/cfzd/Ultra-Fast-Lane-Detection论文地址:https://arxiv.org/abs/2004.117571 数据集准备下载地址:https://github.com/TuSimple/tusimple-benchmark/issues/3下载的train_set.zip、test_set.zip和test_label.json,并解压下载完成后,新建一个文件夹Tusimple,将上面多个放在该文件夹里面1 源码下载原创 2022-04-30 21:30:46 · 1701 阅读 · 2 评论 -
卡尔曼滤波器
卡尔曼滤波器是一种由卡尔曼(Kalman)提出的用于时变线性系统的递归滤波器。这个系统可用包含正交状态变量的微分方程模型来描述,这种滤波器是将过去的测量估计误差合并到新的测量误差中来估计将来的误差。一. 卡尔曼滤波理论回顾状态方程: 测量方程:xk是状态向量,zk是测量向量,Ak是状态转移矩阵,uk是控制向量,Bk是控制矩阵,wk是系统误差(噪声),Hk是测量矩阵,vk是测量误差(噪声)。wk和vk都是高斯噪声,即整个卡尔曼滤波的过程就是个递推计算的过程,不断的“预测——更新——预测——转载 2022-04-12 10:02:29 · 517 阅读 · 0 评论 -
RepVGG:极简架构,SOTA性能,让VGG式模型再次伟大(CVPR-2021)
RepVGG,用结构重参数化(structural re-parameterization)“复兴”VGG式单路极简架构,一路3x3卷到底,在速度和性能上达到SOTA水平,在ImageNet上超过80%正确率。已经被CVPR-2021接收。论文地址:https://link.zhihu.com/?target=https%3A//arxiv.org/abs/2101.03697开源预训练模型和代码(PyTorch版):https://github.com/DingXiaoH/RepVGG本文的VGG转载 2022-04-06 14:44:16 · 729 阅读 · 0 评论 -
resa车道线检测代码阅读
以基于tusimple数据集的模型训练为例子,首先数据集的预处理每当对一张图片进行读取,会截取原图和标签的下大半部分,然后进行数据增强(包括随机旋转、随机水平移动、改变指定的尺寸和归一化)原图的数据格式为float()标签的数据格式应该为long()网络模型的代码损失函数可用交叉熵损失函数或者dice_loss损失函数待更新...原创 2022-02-05 00:23:11 · 3288 阅读 · 4 评论 -
LR-ASPP论文
论文地址:https://arxiv.org/abs/1905.02244、摘要我们提出了基于互补搜索技术的组合以及一个新颖的架构设计的下一代移动网络。MobileNetV3通过结合NetAdapt算法补充的硬件网络架构搜索(NAS)调整到移动电话cpu上,随后通过新的架构进步进行了改进。本文开始探索如何自动搜索算法和网络设计可以一起工作,利用互补的方法来改善整体的艺术状态。通过这个过程,我们为发布创建了两个新的MobileNet模型:MobileNetV3-Large和MobileNetV3-Smal原创 2022-01-12 16:34:23 · 5997 阅读 · 0 评论 -
laneatt代码复现和用自己采集的视频来测试
代码链接:https://github.com/lucastabelini/LaneATT1. 环境配置#代码下载python main.py test --exp_name my_r18_culane --view all# 新建虚拟环境conda create -n laneatt python=3.8 -y#激活虚拟环境conda activate laneatt# 安装torch和torchvisionconda install pytorch==1.6 torchvision原创 2022-01-09 22:43:08 · 5474 阅读 · 40 评论 -
CBAM注意力机制及pytorch实现
简述本文提出了卷积注意力模块,这是一种用于前馈卷积神经网络的简单而有效的注意力模块.Convolutional Block Attention Module (CBAM) 表示卷积模块的注意力机制模块,是一种结合了空间(spatial)和通道(channel)的注意力机制模块。相比于senet只关注通道(channel)的注意力机制可以取得更好的效果。实现过程上图给出了添加CBAM模块之后的整体结构。可以看到的是,卷积层输出的结果,会先通过一个通道注意力模块,得到加权结果之后,会再经过一个空间注意力转载 2021-12-25 19:05:02 · 7672 阅读 · 6 评论 -
重新思考空洞卷积 | RegSeg超越DeepLab、BiSeNetv2让语义分割实时+高精度
语义分割的最新的一些研究通常采用ImageNet预训练Backbone,在其后面加上特殊的上下文模块,以快速增加感受野。虽然取得了一定的效果,但是Backbone也带来了大部分计算。最近的一些进展解决了这个问题,方法是快速降低Backbone的分辨率,同时拥有一个或多个具有更高分辨率的平行分支。作者采用了不同的方法,设计了一个受ResNeXt启发的Block结构,使用2个具有不同的膨胀率的并行3x3卷积层,以扩大感受野,同时保留局部细节。通过在Backbone中重复这个Block结构,不需要在它后面附加.转载 2021-12-01 21:32:54 · 586 阅读 · 0 评论 -
使用多尺度注意力进行语义分割,代码已开源
来自NVIDIA的SOTA语义分割文章,代码开源。转载 2021-11-30 10:25:30 · 733 阅读 · 0 评论 -
语义分割之dice loss深度分析(梯度可视化)
dice loss 来自文章VNet(V-Net: Fully Convolutional Neural Networks for Volumetric Medical Image Segmentation),旨在应对语义分割中正负样本强烈不平衡的场景。本文通过理论推导和实验验证的方式对dice loss进行解析,帮助大家去更好的理解和使用。dice loss定义dice loss来自dice coefficient,是一种用于评估两个样本的相似性的度量函数,取值范围在0到1之间,取值越大表示月相似.d转载 2021-11-29 21:22:34 · 709 阅读 · 0 评论 -
RESA: Recurrent Feature-Shift Aggregator for Lane Detection (AAAI 2021)
公开视频:https://www.bilibili.com/video/BV1664y1o7wg论文:https://arxiv.org/abs/2008.13719源码:https://github.com/ZJULearning/resa现有的车道线检测方法1.基于霍夫变换的传统车道线检测方法,缺点在于不能处理复杂场景(遇到遮挡),不能检测曲线2.基于聚类的实例分割,例如lanent,缺点在于需要后处理,实时性较低,而且聚类的结果存在随机性3.语义分割 例:SCNN4.基于行分类的网络化,原创 2021-11-11 22:40:52 · 5041 阅读 · 5 评论 -
STDC语义分割网络:BiSeNet的轻量化加强版(CVPR2021语义分割)
今天和大家分享CVPR2021中语义分割领域的一篇论文,论文标题及作者如下图所示:论文下载地址:https://arxiv.org/abs/2104.13188代码即将开源:https://github.com/MichaelFan01/STDC-Seg动机深度学习促进了计算视觉领域中语义分割算法的发展;随着自动驾驶、视频监控等应用场景的迫切需求,面向终端的轻量化语义分割网络被广泛研究。为了减少算法的耗时,一些诸如DFANet、BiSenetv1的语义分割算法使用了轻量化的backbone,但是转载 2021-11-09 22:39:59 · 1676 阅读 · 1 评论 -
轻量级实时语义分割:ICNet
ICNet是2018年ECCV提出来的,是一篇实时轻量化语义分割的论文。贡献(1) 提出了一个新颖且独特的图像级联网络用于语义分割,利用了低分辨率语义信息和高分辨率图像的细节(2) 提出的级联特征融合单元和级联标签引导能够以较低的计算成本逐步恢复和细化分割预测(3) ICNet速度快,内存占用少图像级联网络网络结构为了平衡精度和速度,作者提出了image cascade network(ICNet),输入多个分辨率的图像(下采样两倍和四倍)。低分辨率的图像采用pspnet的网络,称之为he转载 2021-11-02 19:15:43 · 1805 阅读 · 2 评论 -
轻量级实时语义分割经典BiSeNet
基于轻量化网络模型的设计作为一个热门的研究方法,许多研究者都在运算量、参数量和精度之间寻找平衡,希望使用尽量少的运算量和参数量的同时获得较高的模型精度。目前,轻量级模型主要有SqueezeNet、MobileNet系列和ShuffleNet系列等,这些模型在图像分类领域取得了不错的效果,可以作为基本的主干网络应用于语义分割任务当中。然而,在语义分割领域,由于需要对输入图片进行逐像素的分类,运算量很大。通常,为了减少语义分割所产生的计算量,通常而言有两种方式:减小图片大小和降低模型复杂度。减小图片大小可以最转载 2021-11-02 10:16:52 · 735 阅读 · 0 评论 -
金字塔池化模型PPM-Pyramid pooling module
Pyramid pooling 方法出自 2017CVPR,原文地址https://arxiv.org/pdf/1612.01105.pdf该文的一大贡献就是Pyramid pooling module(简称PPM)1. PPM有什么用一般可以粗略地认为感受野就是使用上下文信息的大小。在很多网络中,我们都很重视全局信息的获取。在FCN中,就是没有充分的场景的上下文信息,导致在一些不同尺度的物体分割上处理不好。没有充分利用好场景的上下文信息就会有这些问题(分别如上图所示):(1)Mismatche转载 2021-10-29 10:49:22 · 2248 阅读 · 1 评论 -
苹果公司提出Mobile-ViT | 更小更轻精度更高,MobileNets或成为历史
MobileviT是一个用于移动设备的轻量级通用可视化Transformer,据作者介绍,这是第一次基于轻量级CNN网络性能的轻量级ViT工作,性能SOTA!。性能优于MobileNetV3、CrossviT等网络。1.简介轻量级卷积神经网络(CNN)是移动视觉任务的实际应用,它们的空间归纳偏差允许它们在不同的视觉任务中以较少的参数学习表征.然而,这些网络在空间上是局部.为了学习全局表征,采用基于自注意力的Vision Transformer(ViTs).在本文中,本文提出了以下问题:是否有可能结合.转载 2021-10-29 09:47:03 · 4900 阅读 · 4 评论 -
快到起飞 | PP-LCNet在CPU上让模型起飞,精度提升且比MobileNetV3+快3倍
本文提出了一种基于MKLDNN加速策略的轻量级CPU网络,即PP-LCNet,它提高了轻量级模型在多任务上的性能,对于计算机视觉的下游任务,如目标检测、语义分割等,也有很好的表现。1.简介随着模型特征提取能力的提高及其模型参数和FLOPS数量的增加,在基于ARM架构的移动设备或者基于x86架构的cpu设备上实现快速推理变得困难.在这种情况下,已经提出了许多优秀的Mobile网络 ,但是由于MLKDNN的限制,这些网络的速度在启动MKLDNN的Interl CPU上并不理想.在本文中,作者重新思考了在I转载 2021-10-24 17:02:01 · 896 阅读 · 1 评论 -
Ultra Fast Structure-aware Deep Lane Detection
2相关工作传统的方法通常是基于视觉信息来解决车道检测问题。这些方法的主要思想是通过HSI颜色模型[25]和边缘提取算法等图像处理来利用视觉线索[29,27]。当视觉信息不够强时,跟踪是另一种流行的后处理方案[28,13]。除跟踪外,还采用了马尔可夫和条件随机场[16]作为后处理方法。随着机器学习的发展,提出了一些采用模板匹配、支持向量机等算法的方法[15,6,20]。随着深度学习的发展,一些基于深度神经网络的方法[12,11]在车道检测方面显示出了优势。这些方法通常使用相同的公式,将问题视为语义分割任务原创 2021-09-27 11:48:06 · 2340 阅读 · 3 评论 -
CoTNet
论文链接:https://arxiv.org/abs/2107.12292代码链接:https://link.zhihu.com/?target=https%3A//github.com/JDAI-CV/CoTNet核心代码链接:https://github.com/xmu-xiaoma666/External-Attention-pytorch#22-CoTAttention-Usage目的起初,CNN由于其强大的视觉表示学习能力,被广泛使用在各种CV任务中,CNN这种局部信息建模的结构充分使用了转载 2021-08-10 09:40:55 · 1450 阅读 · 1 评论 -
Keep your Eyes on the Lane: Real-time Attention-guided Lane Detection
论文链接:https://arxiv.org/pdf/2010.12035.pdf代码链接:https://github.com/lucastabelini/LaneATT摘要:现代车道检测方法在复杂的现实场景中取得了显著的性能,但是许多方法存在保持实时效率的问题,这对于自动驾驶车辆来说很重要。在这项工作中,我们提出了LaneATT:一个基于锚点的深度车道检测模型,它类似于其他通用的深度物体检测器,使用锚点进行特征池步骤。由于车道遵循规则的模式并且高度相关,我们假设在某些情况下,全局信息对于推断它们的原创 2021-07-15 10:27:37 · 625 阅读 · 0 评论 -
Mask RCNN 算法笔记
论文:Mask RCNN论文链接:https://arxiv.org/abs/1703.06870官方代码链接:https://github.com/facebookresearch/DetectronMask R-CNN是ICCV2017的best paper,在一个网络中同时做语义分割和实例分割。该算法在单GPU上的运行速度差不多是5 fps,并且在COCO数据集的三个挑战赛:instance segmentation、bounding-box object detecton、person key转载 2021-07-01 14:07:07 · 178 阅读 · 0 评论 -
Mask R-CNN原理详细解读
Mask R-CNN是在Faster R-CNN的基础上添加了一个预测分割mask的分支, ,如上图所示。其中黑色部分为原来的Faster-RCNN,红色部分为在Faster-RCNN网络上的修改。将RoI Pooling 层替换成了RoIAlign层;添加了并列的FCN层(mask层)。一、RolAlign首先介绍一下RoIPooling,它的目的是为了从RPN网络确定的ROI中导出较小的特征图(a small feature map,eg 7x7),ROI的大小各不相同,但是RoIPool后都变成.转载 2021-07-01 11:27:44 · 755 阅读 · 0 评论 -
ResMLP: Feedforward networks for image classification with data-efficient training
1原创 2021-06-10 19:48:49 · 409 阅读 · 0 评论 -
残差网络详诉
残差原创 2021-04-30 16:58:28 · 954 阅读 · 1 评论 -
匈牙利算法Hungarian algorithm
匈牙利算法是解决寻找二分图最大匹配的。匈牙利算法(Hungarian Algorithm)是一种组合优化算法(combinatorial optimization algorithm),用于求解指派问题(assignment problem),算法时间复杂度为O(n3)O(n3)。Harold Kuhn发表于1955年,由于该算法基于两位匈牙利数学家的早期研究成果,所以被称作“匈牙利算法”。(一)预备知识什么是二分图:二分图又称作二部图,是图论中的一种特殊模型。 设G=(V,E)是一个无向图,如果顶点原创 2021-04-27 14:18:57 · 2390 阅读 · 0 评论 -
车道线评价指标
1. fps1秒内识别的图像数(帧数)2.MACs?(求指导)3. Para参数的数量以M(百万)为单位(参数的数量除以一百万)4. PP是否使用后处理5. ACC准确度(Accuracy)6. FP和FNFP(False Positive):假正例,模型预测为正例,实际是反例 (模型预测为类别1,实际是类别2)FN(False Negative):假反例,模型预测为反例,实际是正例 (模型预测为类别2,实际是类别1)...原创 2021-03-23 10:22:42 · 1676 阅读 · 2 评论 -
《End-to-end Lane Shape Prediction with Transformers》论文笔记
这是个人的学习笔记,如有侵权,请联系本人。还在更新代码摘要车道线检测的过程可以视为近似曲线,如今The popular pipeline分两步解决-特征提取加上后处理这种方法虽然很有用,但是效率不高,并且在处理图片上下文信息和车道的细长结构存在缺陷。为了解决这些问题,本文提出了一种端到端的直接输出车道形状模型参数的方法,能学习更丰富的结构和上下文信息。该模型基于车道线结构和摄像机姿态建立,为网络输出参数提供物理解释。Transformer模型的非局部相互作用以自我注意机制来捕捉更为细长结构和上下文信原创 2021-03-15 21:33:18 · 2500 阅读 · 1 评论 -
《Fast-SCNN: Fast Semantic Segmentation Network》代码复现
本篇的内容展示在TX2的平台上,《Fast-SCNN: Fast Semantic Segmentation Network》代码复现结果展示文章目录trainevaldemotrain在终端输入sudo python3 train.py --model fast_scnn --dataset citys输出结果eval在终端输入sudo python3 eval.py输出结果demo在终端输入sudo python3 demo.py --model fast_scnn --原创 2021-03-13 10:51:25 · 667 阅读 · 5 评论