自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(86)
  • 收藏
  • 关注

原创 Accelerate的使用说明

Accelerate是为PyTorch用户设计的库,旨在简化分布式训练和混合精度训练过程。它提供了一种轻松加速和扩展PyTorch训练脚本的方式,无需编写繁琐的样板代码。Accelerate的API相对简单,仅包含一个Accelerator对象类,使用户能够更轻松地利用多GPU、TPU等计算资源,同时保持对训练循环的完全控制。

2024-07-15 14:52:28 545

原创 【论文阅读】《Visual Prompt Tuning》

目前调整预训练模型的工作方式包括更新所有骨干参数,即。本文介绍了,作为大规模视觉变换器模型全面微调的高效替代方案。VPT 从高效调整大型语言模型的最新进展中汲取灵感,只在输入空间中引入少量(少于模型参数的 1%)可训练参数,同时保持模型主干冻结。通过对各种下游识别任务的广泛实验,我们发现与其他参数高效调整协议相比,VPT 能显著提高性能。最重要的是,在模型容量和训练数据规模方面,VPT 在很多情况下甚至优于完全微调,同时降低了每个任务的存储成本。代码见。

2024-07-15 14:51:51 1135

原创 Linux对文件夹操作(复制,移动)

之前说过,如果目标目录下已经存在同名文件,则会提示是否覆盖,需要手工确认。这时如果移动的同名文件较多,则需要一个一个文件进行确认,很不方便。如果我们确认需要覆盖已经存在的同名文件,则可以使用。既然可以强制覆盖移动,那也有可能需要不覆盖的移动。如果需要移动几百个同名文件,但是不想覆盖,这时就需要 “-n” 选项的帮助了。cp 命令既可以复制文件,也可以复制目录。接下来我们看看如何复制目录,其实复制目录只需使用。进行强制移动,这就不再需要用户手工确认了。移动之后,源文件会被删除,【例 1】移动文件或目录。

2024-07-03 21:03:37 1063

原创 RuntimeError: GET was unable to find an engine to execute this computation问题原因及解决办法

这个错误网上大多数说是因为torch torchvision cuda以及python版本都是有兼容关系的,经过查找材料,原因猜测是因为torch版本过高,但是torchvision版本过低或者不兼容导致的;常用的解决方法是降低torch版本等,这里使用另外一种方法。

2024-07-03 21:03:07 2115 2

原创 论文阅读《One-Step Image Translation with Text-to-Image Models》

在这项工作中,我们解决了现有条件扩散模型的两个局限性:迭代去噪过程导致的推理,以及模型微调对的依赖。为了解决这些问题,我们引入了一种通用方法,。具体来说,我们将 vanilla 潜在扩散模型的各种模块整合到一个具有较小可训练权重的端到端生成器网络中,从而增强了其保持输入图像结构的能力,同时减少了过拟合。我们证明,在非配对环境下,我们的模型 CycleGAN-Turbo 在各种场景转换任务中的表现优于现有的基于 GAN 和基于扩散的方法,如昼夜转换和添加/移除雾、雪、雨等天气效果。

2024-06-30 14:11:14 618

原创 论文阅读《U-KAN Makes Strong Backbone for MedicalImage Segmentation and Generation》

U-Net 已成为图像分割和扩散概率模型等各种视觉应用的基石。虽然通过结合transformer或 MLP,U-Net 已经引入了许多创新设计和改进,但仍然,而且可解释性不足。为了应对这些挑战,我们的直觉受到了 Kolmogorov-Arnold 网络(KANs)在准确性和可解释性方面令人印象深刻的成果的启发,KANs 通过从 KolmogorovAnold 表示定理衍生出的重塑了神经网络学习。具体来说,在本文中,我们探索了 KAN 在改进视觉任务骨干方面尚未开发的潜力。

2024-06-30 14:10:20 1621

原创 Stable Diffusion学习

如果不解释无分类器引导(Classifier-Free Guidance,CFG),这篇文章将是不完整的,这是AI艺术家每天调来调去的值。要了解它是什么,我们需要首先触及它的前身,分类器引导(Classifier Guidance)。

2024-06-26 18:11:30 1162

原创 Window和Linux设置代理和取消代理(http_proxy)

需要git clone下载项目的时候,一直clone不下来,则需要添加代理特别注意,在图形界面中设置代理之后,还需要在终端命令行中设置,否则终端无法使用。

2024-06-26 11:47:15 408

原创 从Colab中下载文件夹到本地电脑或者Google Drive

3、下载完成后,将这个文件从本地电脑中解压缩出来,就可以得到你要下载的文件夹了。是你要下载的文件夹的名称。运行完这个命令后,压缩文件会保存在当前工作目录下。1、在Colab中运行以下代码,将要下载的文件夹压缩成。2、在Colab左侧的文件导航栏中,找到你刚才压缩的。这会将你的Google Drive。文件,右键点击它并选择“下载”。

2024-06-24 23:24:25 613

原创 Anaconda创建环境时报错CondaHTTPError

发现报。

2024-06-24 14:20:27 667

原创 【论文阅读】《Sketch and Refine: Towards Fast and Accurate Lane Detection》

车道检测是指确定道路上车道的精确位置和形状。尽管目前的方法已经做出了努力,但由于现实世界场景的复杂性,这仍然是一项具有挑战性的任务。无论是基于建议的方法还是基于关键点的方法,现有方法都无法有效、高效地描绘车道。基于建议(proposal)的方法通过的精简方式区分和回归建议集合来检测车道,但在车道表示方面缺乏足够的灵活性。另一方面,基于关键点的方法可根据局部描述符(local descriptors)灵活构建车道,但通常需要。在本文中,我们提出了一种范式,它同时利用。

2024-06-14 14:18:08 611 1

原创 【论文阅读】CLRKDNet: Speeding up Lane Detection with Knowledge Distillation

车道是智能车辆视觉感知系统不可或缺的组成部分,在安全导航中起着举足轻重的作用。在车道检测任务中,兼顾准确性和实时性至关重要,但现有方法往往舍本逐末。为了解决这一权衡问题,我们引入了 CLRKDNet,这是一种兼顾检测准确性和实时性的精简模型。最先进的模型 CLRNet 在各种数据集上都表现出了卓越的性能,但由于其,其计算开销很大。我们的方法简化了 FPN 结构和检测头,对它们进行了重新设计,将新颖的与新引入的一系列蒸馏损失结合在一起。

2024-06-14 14:17:43 772

原创 【论文阅读】<YOLOP: You Only Look Once for PanopticDriving Perception>

全视驾驶感知系统是自动驾驶的重要组成部分。一个高精度的实时感知系统可以帮助车辆在驾驶时做出合理的决策。我们提出了一个全视驾驶感知网络(您只需寻找一次全视驾驶感知网络(YOLOP)),以同时执行交通目标检测、可驾驶区域分割和车道检测。它由一个用于特征提取的编码器和三个用于处理特定任务的解码器组成。我们的模型在具有挑战性的BDD100K数据集上表现得非常好,在准确性和速度方面,在所有三个任务上都实现了最先进的水平。此外,我们通过消融研究验证了我们的多任务学习模型对联合训练的有效性。

2024-05-09 09:24:31 1302

原创 【论文阅读】《Lane2Seq: Towards Unified Lane Detection via Sequence Generation》

在本文中,我们提出了一种新颖的基于序列生成的车道检测框架,称为Lane2Seq。它将车道检测作为序列生成任务,从而统一了各种车道检测格式。这不同于以往的车道检测方法,后者依赖于。Lane2Seq 只采用了基于简单变换器的编码器-解码器架构,并采用了简单的。此外,我们还提出了一种新的基于强化学习的多格式模型调整方法,以便将特定任务知识纳入 Lane2Seq。实验结果表明,这种简单的序列生成范例不仅统一了车道检测,还在基准测试中取得了具有竞争力的性能。

2024-05-09 09:24:01 685

原创 Latex | LaTeX 减小图片和文字之间的距离/间距设置

不知道是不是我模板设置的问题,在文章开头使用该语句后,表格的标题与正文之间的间距也发生了改变,导致表格的格式看上去非常非常的丑!针对每一幅图像操作,如果图像比较多,工作量就比较大;很明显,一句话可以实现上百甚至上千个图像的更改。使用(可以分别使用,只调整上间距或者下间距)。可以对整篇文章的图像格式进行调整。在双栏的情况下,图片是一栏的情况。不会出现别的bug!

2024-03-20 11:04:49 1859

原创 Latex中设置字体颜色(三种方式)

usepackage{color} %引入包其中中包含的是系统定义好的颜色,{text}是你的文本内容。\definecolor{ColorName}{rgb}{r,g,b} 这时r/g/b的定义域就在[0-1]。\definecolor{ColorName}{RGB}{R,G,B} 这时R/G/B的定义域就在[0-255]。这里为颜色定义了名称ColorName,下面可以直接调用这个颜色方案。

2024-03-20 10:43:29 8760

原创 Latex插入pdf图片,去除空白部分

这个网址进行转换。Latex的图片插入支持PDF文件,这里笔者建议都使用PDF文件进行图片的插入,因为PDF作为矢量图是。有些期刊要求上传PNG、JPG等图片格式,PDF转JPG - 在线转换PDF文件 (

2024-03-18 23:11:50 2633

原创 解决:visio导出公式为pdf图片乱码问题

今天需要将Visio编辑好的以后的图输出pdf,但是点击保存后公式部分一直。,存到桌面,不要直接点击保存。保存时点击文件下方的。

2024-03-18 23:00:15 1460

原创 论文阅读《FENET: FOCUSING ENHANCED NETWORK FOR LANE DETECTION》

受人类驾驶专注力的启发,这项研究开创性地利用等技术增强网络,有针对性地创新解决了自动驾驶精确车道检测的障碍。实验证明,我们的 "聚焦采样 "策略与统一方法不同,强调重要的远距离细节,显著提高了对安全至关重要的基准和实际弯道/远距离车道识别精度。FENetV1 通过模拟驾驶员视觉的增强隔离透视感知上下文,实现了最先进的度量性能,而 FENetV2 则在建议的中被证明是最可靠的。因此,我们特别推荐将 V2 用于实际的车道导航,尽管它在标准的全图像度量上有一定程度的下降。

2024-03-10 10:47:24 1282 1

原创 LaTeX中控制表格整体高度和宽度

例如,\resizebox{0.8\textwidth}{!}{表格内容}将表格缩小到页面宽度的80%,高度自适应。该命令将表格作为参数,并接受一个比例因子,可以缩放表格的大小。另外,也可以使用\resizebox命令来控制表格的大小。使用tabular环境创建表格时,可以使用。{表格内容}将表格缩小到80%的大小。接受三个参数:宽度、高度和表格内容。表示表格宽度为当前文本宽度的一半。命令来控制表格的整体高度和宽度。等,也可以是相对长度,如。

2024-03-04 10:09:23 2521

原创 latex入门指南:插入图片、表格、公式方法一览

单元格内容:默认左对齐,为了指定对齐方式,可以使用[\centering 居中;\raggedright 左对齐]的规则。如p{1cm}

2024-03-04 10:09:06 2169

原创 LaTeX中的多行数学公式

数学符号字体mathbb命令的使用,数学运算符in命令和setminus命令的使用。2、可以使用gather环境和gather*环境,分别排版编号公式和不编号公式。编译结果,我们可以看到,前两行公式没有被编号,最后一个公式被编号了。环境,在公式排版中,用&按指定位置进行对齐。3、也可以使用align环境和align*环境来设定公式中的对齐方式。不但实现了公式的分行排版,并且对每一行公式都进行了编号。5、使用cases环境实现类似分段函数公式的排版。实现了多行公式的排版,但并没有对公式进行编号。

2024-03-03 23:03:17 3074

原创 【latex】\IEEEpubid版权声明与正文内容重叠

【代码】【latex】\IEEEpubid版权声明与正文内容重叠。

2024-03-03 23:03:04 1348 3

原创 latex小技巧

将输入大写罗马数字5将输入小写罗马数字5。

2024-03-02 20:25:45 4224

原创 latex使用Bibtex添加参考文献指南(TeXstudio)

我们还可以通过参考文献样式的支持,让同一份 BibTeX数据库生成不同样式的参考文献列表。如果不使用bib文件,你就得在latex中按要求自己排版参考文献的格式,少不了来回捣腾endnote,zetero之类的参考文献管理工具,但是有了bib文件,真的方便许多!其中,clrnet是文献简称,可以自己取名字,保持和bib文件中的内容一致就可以。refstyle这个要看你投的那个期刊/会议是什么格式的,它们会有说。注意,这个地方的内容,是这个文献的简称,你可以自己。在后面引用的使用的就是这个名称。

2024-03-02 20:08:43 10836 1

原创 贝塞尔曲线(Bezier Curve)原理、公式推导及matlab代码实现

贝塞尔曲线用于计算机图形绘制形状,CSS 动画和许多其他地方。贝塞尔曲线(Bezier curve),又称贝兹曲线或贝济埃曲线,是应用于二维图形应用程序的数学曲线。起始点、终止点(也称锚点)、控制点。通过调整控制点,贝塞尔曲线的形状会发生变化。贝塞尔曲线是计算机图形学中相当重要的参数曲线,在一些比较成熟的位图软件中也有贝塞尔曲线工具,如PhotoShop等。1962年,法国数学家第一个研究了这种矢量。

2024-01-18 11:30:09 3531

原创 Linux中screen命令详解

Screen被称之为一个全屏窗口管理器, 用户可以通过该软件同时连接多个本地或远程的命令行会话,并在其间自由切换。注意有会话(session)和窗口(window)两个概念。进入screen会话后,可在会话中创建多个窗口(window)。需要明确三个窗口的概念。默认窗口所谓默认窗口就是我们没有用screen命令时的那个干干净净的窗口,不能使用等会介绍的screen命令下的任何快捷键。

2023-12-28 11:16:57 2992 2

原创 论文阅读《Rethinking Efficient Lane Detection via Curve Modeling》

这篇论文提出了一种新颖的基于参数曲线的方法,用于在RGB图像中进行车道线检测。与通常需要启发式方法来解码预测或制定大量锚点的先进的基于分割和点检测的方法不同,基于曲线的方法可以自然地学习整体的车道表示。为了处理现有多项式曲线方法的优化困难,我们提出利用参数化的贝塞尔曲线,因为它易于计算、稳定,并且具有高自由度的变换。此外,我们提出了基于可变形卷积的特征翻转融合,以利用驾驶场景中车道的对称性质。所提出的方法在流行的LLAMAS基准测试中实现了新的最先进性能。

2023-12-27 21:59:01 1782 1

原创 Google Scholar引用没有GB/T格式

1、GB/T 7714:(我国)国家标准的代号由大写汉语拼音字母构成。强制性国家标准的代号为"GB",推荐性国家标准的代号为"GB/T"。国家标准的编号由国家标准的代号、国家标准发布的顺序号和国家标准发布的年号(即发布年份的后两位数字)构成。示例: GB×××× GB/T××××。

2023-12-17 16:26:42 4881 3

原创 Linux查看进程PID以及杀掉进程的方法

Linux作为一款多用户、多任务的操作系统,可以同时处理多个任务,每个任务的执行都由进程来实现。在每个进程执行的过程中,都会有一个唯一标识符,即称为进程ID。Linux系统有很多命令用来查看进程PID,下面介绍几种常用的查看进程PID的方法。

2023-12-17 16:14:03 1941

原创 strict=False 但还是 size mismatch for xx.weight copying a param with shape [] from checkpoint错误的解决方法

pop掉。

2023-12-17 15:48:32 2511

原创 【目标检测算法】IOU、GIOU、DIOU、CIOU

IOU --> GIOU --> DIOU -->CIOU损失函数,每一种损失函数都较上一种损失函数有所提升。下面来具体介绍这几种损失函数。CIOU的对比重叠面积、中心点距离、纵横比IoU: 考虑了重叠面积,归一化坐标尺度GIoU: 考虑了重叠面积,基于IoU解决边界框不相交时loss等于0的问题。DIoU: 考虑了重叠面积、中心点距离,基于IoU解决GIoU收敛慢的问题CIoU: 考虑了重叠面积、中心点距离、纵横比,基于DIoU提升回归精确度。

2023-12-07 12:42:39 1262

原创 Linux下查看pytorch运行时真正调用的cuda版本

一般情况我们会安装使用多个cuda版本。而且pytorch在安装时也会自动安装一个对应的版本。

2023-11-18 16:29:49 499

原创 Linux下非root用户安装CUDA

由于一些代码实现(CUDA写的)对cuda版本要求比较高,因此,我在实验室Linux系统下默认的cuda版本上,没办法编译扩展包。需要重新安装特定版本的cuda。

2023-11-17 21:46:02 3607 6

原创 Linux(多用户下)查看cuda、cudnn版本、查看已经安装的cuda版本相关命令

linux 中cuda默认安装在/usr/local目录中:查看该目录下有哪些cuda版本:具体的版本可以通过:nvcc -V# (V大写) 查看。

2023-11-16 19:06:42 1901

原创 conda虚拟环境中安装的cuda和服务器上安装的cuda的异同

但是当我们在Anaconda虚拟环境下安装pytorch或者paddlepaddle等深度学习框架的GPU版本时,通常会选择较高版本的cuda,这样服务器就存在两个cuda版本,但是/usr/local的目录下只有Nvidia家的cuda版本,这是为什么呢?使用 Nvidia 官网提供的 CUDA Toolkit 可以安装开发 CUDA 程序所需的工具,包括 CUDA 程序的编译器、IDE、调试器等,CUDA 程序所对应的各式库文件以及它们的头文件。如下图所示,服务器上已安装好的cuda版本为10.1。

2023-11-16 18:04:31 2363

原创 用人话讲解深度学习中CUDA,cudatookit,cudnn和pytorch的关系

CUDA看作是一个工作台,上面配有很多工具,如锤子、螺丝刀等。cuDNN是基于CUDA的深度学习GPU加速库,有了它才能在GPU上完成深度学习的计算。它就相当于工作的工具,比如它就是个扳手。但是CUDA这个工作台买来的时候,并没有送扳手。想要在CUDA上运行深度神经网络,就要安装cuDNN,就像你想要拧个螺帽就要把扳手买回来。这样才能使GPU进行深度神经网络的工作,工作速度相较CPU快很多。总结一下。

2023-11-16 17:05:38 532

原创 【Bug解决】nvcc fatal : Unsupported gpu architecture ‘compute_86‘

GPU 3090 硬件能够支持的算力比较高,能达到 8.6,而当前 CUDA 11.1 不支持算力 8.6。注:感觉该环境变量会有点问题,运行完代码又改回去了。

2023-11-13 22:52:43 1126

原创 [论文阅读] CLRerNet: Improving Confidence of Lane Detection with LaneIoU

车道标记检测是自动驾驶和驾驶辅助系统的重要组成部分。采用的车道表示的现代深度车道检测方法在车道检测基准测试中表现出色。通过初步的Oracle实验,我们首先拆分了车道表示组件,以确定我们方法的方向。我们的研究表明,。基于这一发现,我们提出了LaneIoU,通过考虑局,更好地与度量相关联。我们开发了一种新颖的检测器(CLRerNet),它采用 LaneIoU 作为目标分配成本和损失函数,旨在提高置信度分数的质量。

2023-11-10 16:09:47 1239

原创 nvidia-smi 实时刷新 实时显示显存使用情况

【代码】nvidia-smi 实时刷新 实时显示显存使用情况。

2023-11-07 20:14:18 663

Linux服务器指令,深度学习

Linux服务器指令,深度学习

2023-12-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除