- 博客(77)
- 资源 (15)
- 收藏
- 关注
原创 系统驾驶舱前端开发新手入门--全代码打包
本文介绍了一个环境数据可视化前端项目的实现方案,通过 ECharts 图表库结合 HTML/CSS 构建了多功能数据展示系统。核心功能包括中心地图与点位标注、六种污染物实时数据卡片、地区污染治理堆叠柱状图、实时事件滚动通报、四地区环境质量饼图以及气温降水双折线图等可视化组件,实现了环境数据的直观呈现与动态交互效果。
2025-06-10 17:43:09
450
原创 Yolo/VOC样本在原图上画框代码及样本示例
本文介绍的两个代码为可视化目标检测数据集提供解决方案,将样本标签在原图上画框展示,YOLO工具适用于现代检测框架如YOLOv5-v11,而VOC工具兼容传统的PASCAL VOC数据集。完整代码见下方复制粘贴或者网盘下载。
2025-06-10 14:19:33
197
原创 网页版便签应用开发:HTML5本地存储与拖拽交互实践
本文详细介绍了一个基于HTML5的便签应用开发过程,重点讲解了如何利用localStorage实现数据持久化存储,以及如何实现流畅的拖拽交互体验。该应用具有创建、编辑、删除便签功能,自动保存用户内容,并支持多便签管理。文章将深入解析核心实现代码,并提供完整的开发案例。
2025-06-09 19:24:00
530
原创 Delivering Arbitrary-Modal Semantic Segmentation(CVPR2023)任意模态语义分割论文阅读
本研究提出了DeLiVER数据集和CMNeXt跨模态分割模型,旨在通过多模态融合提高语义分割的鲁棒性。DeLiVER数据集包含多种模态和恶劣环境条件,涵盖了5种天气、4种传感器故障情况以及多个视角。基于该数据集,本文提出的CMNeXt模型通过自查询中心(SQ-Hub)和并行池化混合器(PPX)有效地融合不同模态信息,实现了在六个基准数据集上的最先进性能。CMNeXt在DeLiVER数据集上的mIoU提升了9.1个百分点,展示了其在恶劣天气和传感器故障情况下的强大鲁棒性。
2025-06-09 11:33:19
878
1
原创 DFORMER: RETHINKING RGBD REPRESENTATION LEARNING FOR SEMANTIC SEGMENTATION 论文浅析
本文提出了 DFormer,这是一种新颖的 RGB-D 预训练框架,用于学习 RGB-D 分割任务的可转移表示。 DFormer 有两项新的关键创新: 1) 与以前使用 RGB 预训练主干对 RGB-D 信息进行编码的工作不同,我们使用来自 ImageNet-1K 的图像深度对对主干进行预训练,因此 DFormer 被赋予了编码 RGB-D 表示的能力; 2) DFormer 由一系列 RGB-D 块组成,这些块通过新颖的构建块设计为编码 RGB 和深度信息而量身定制。 DFormer 避免了 RGB
2025-06-05 17:43:25
1116
原创 地理空间基础大模型微调: TerraTorch对Prithvi-EO-2.0微调滑坡检测实战
本文使用 IBM/NASA 开发的 **TerratTorch** 库微调 **Prithvi-EO-2.0** 地理空间基础模型,在 **Landslide4Sense** 数据集上进行滑坡检测任务。Prithvi-EO-2.0 是一个600M参数的多时态地理空间模型,通过对NASA的Harmonized Landsat和Sentinel-2数据集进行预训练,能够在滑坡检测任务中提供出色的表现。
2025-06-05 08:45:00
797
原创 Mermaid 绘图--以企业权限视图为例
本文介绍了如何使用 Mermaid 绘制企业权限关系图,通过图表的层级设计和颜色编码,使企业权限体系更加直观易懂。通过示例代码,展示了如何为总经理、部门经理、组领导以及销售专员等不同角色设计清晰的权限视图。此外,还介绍了组织架构、图表需求与实现以及角色权限展示的嵌套结构,帮助开发者在企业管理系统中有效地展示不同层级的权限。此方法能提升管理者对权限体系的理解,有助于提高系统的可维护性与用户体验。
2025-06-04 19:56:20
1135
原创 Prithvi-EO-2.0: A Versatile Multi-TemporalFoundation Model for Earth Observation Applications论文阅读
Prithvi-EO-2.0 在遥感领域代表了一个重要的进展,它通过引入四时间步长的时空联合建模,突破了传统模型仅支持单时相或小块区域的限制。该模型使用NASA HLS档案的预训练数据集,涵盖了420万样本,跨越十年,能够有效捕捉长期趋势和季节性变化。一个关键创新是将地理和时间元数据融合为可学习的嵌入偏置,并通过引入丢弃机制(dropout)提高了模型对缺失数据的鲁棒性。该模型采用600M参数的ViT-H架构,并配合3D卷积处理时空立方体,在多个下游微调任务中表现优异。
2025-06-04 10:42:33
307
1
原创 Foundation Models for Generalist Geospatial Artificial Intelligence(NASA发布Prithvi-EO )论文阅读
本文提出Prithvi——首个专为地球观测设计的地理空间基础模型(GFM),通过自监督学习在超1TB NASA HLS多光谱卫星影像上预训练,并针对云隙填补、洪水制图、野火痕迹分割、多时相作物分类等任务进行高效微调。
2025-06-03 19:37:51
896
1
原创 Depth Anything V2:单目测距深度估计可执行代码分享与文章浅析
传统的单目深度估计基准,如NYU-D和KITTI,已经在研究中得到了广泛应用。然而,这些方法存在局限性。为了应对这些挑战,《Depth Anything V2》提出了一个新的评估基准——DA-2K,旨在为单目深度估计提供更精确、更全面的测试标准。
2025-04-16 16:43:31
1097
3
原创 UNet++: A Nested U-Net Architecture for Medical Image Segmentation可运行代码分享与模型原理简析
文章《UNet++: A Nested U-Net Architecture for Medical Image Segmentation》,作者认为,当编码器网络中的高分辨率特征图与解码器网络中语义丰富的特征图融合之前先被逐渐丰富,能够使模型更有效地捕捉前景物体的细粒度细节,因此提出了一种密集连接的UNet++模型。该架构本质上是一个深度监督的编码器-解码器网络,其中编码器和解码器子网络通过一系列嵌套的密集跳跃路径相连接,重新设计的跳跃路径旨在减少编码器和解码器子网络之间特征图的语义差距。
2025-04-07 11:00:00
1443
1
原创 30种经典GAN代码集锦及数据分享
一站式生成对抗网络研究与实践指南,该仓库因维护者时间限制已暂停更新,博主增加了数据试用后打包在百度云盘中,供分享。通过网盘分享的文件GAN.zip链接: https://pan.baidu.com/s/1vI8MdaQJMn-D4fn-crKALA?pwd=2rk7 提取码: 2rk7。
2025-04-02 17:41:05
344
1
原创 Semantic Flow for Fast and Accurate Scene Parsing可执行代码分享及语义流对齐思路介绍
论文《Semantic Flow for Fast and Accurate Scene Parsing》原理解析及可执行代码分享,用于滑坡检测示例。光流的理念来自于视频处理任务,在对齐两个相邻的视频帧特征时光流非常有效且灵活,这启发作者设计了一种基于流对齐模块(FAM),通过在网络内部预测流场来对齐两个相邻层次的特征图。作者将这种流场定义为语义流,它是在特征金字塔的不同层次之间生成的。
2025-04-02 14:40:38
1049
1
原创 铁路语义分割数据下载RailSem19: A Dataset for Semantic Rail Scene Understanding
RailSem19 是一个为铁路、道路场景理解提供丰富语义信息的数据集。它包含了 8500 张 由铁路车辆(包括火车和有轨电车)以自视角拍摄的图像,这些图像展示了在铁路和道路交汇区域的各种场景,包括铁路道口、城市街道上行驶的电车等。
2025-04-01 14:43:38
590
4
原创 Access to XMLHttpRequest at ‘file:///F:*from origin ‘null‘ has been blocked by CORS policy解决方法
这个问题是由于浏览器的 **跨域资源共享(CORS)** 策略引起的。具体来说,浏览器禁止了从本地文件路径(`file://`)加载资源的请求,因为 CORS 策略只允许某些协议(如 `http`、`https` 等)进行跨域请求。
2025-03-21 15:10:57
1034
1
原创 深度学习PyTorch之动态计算图可视化 - 使用 torchviz 生成计算图
在深度学习模型的开发过程中,理解和可视化模型的计算图对于调试、优化和教学都具有重要意义。PyTorch 采用的是动态图机制,这使得每次前向传播时计算图都被动态创建。而 `torchviz` 是一个非常有用的工具,它可以将这些动态图转化为可视化图形,帮助我们更直观地理解模型的计算过程。在本篇博客中,我们将重点介绍如何使用 `torchviz` 生成和保存 PyTorch 模型的计算图,并结合实际训练代码进行展示。
2025-03-21 10:12:10
1533
1
原创 graphviz.backend.ExecutableNotFound: failed to execute ‘dot‘, make sure the Graphviz executables are
如果直接pip install torchziv,会直接将graphviz,torchziv两个都安装好,但是这种方法无法将graphviz导入系统路径。下载zip,解压后复制到python路径下即可。
2025-03-20 17:40:07
162
1
原创 源自Deformable Convolutional Networks的一种可变形卷积实现解析
在深度学习中的计算机视觉任务中,卷积神经网络(CNN)是最常见且强大的模型之一。然而,传统的卷积操作在处理具有几何变换(如旋转、平移、缩放等)或变形的图像时,通常表现得不够灵活。为了解决这一问题,**可变形卷积(Deformable Convolution)**应运而生。本文将详细解析DeformConv2D 类,它是可变形卷积的一种实现,帮助我们更好地理解可变形卷积的工作原理。
2025-03-20 16:47:37
1062
1
原创 Rethinking BiSeNet For Real-time Semantic Segmentation细节损失函数学习
本博客为文章“Rethinking BiSeNet For Real-time Semantic Segmentation”损失函数学习和使用。细节图像中,细节像素的数量远少于非细节像素,细节预测是一个类别不平衡问题。因为加权交叉熵总是导致粗糙的结果,文章采用二元交叉熵和Dice损失来联合优化细节学习。
2025-03-19 18:54:14
953
1
原创 PIDNet: A Real-time Semantic Segmentation Network Inspired by PID Controllers原理解析与代码分享
PIDNet: A Real-time Semantic Segmentation Network Inspired by PID Controllers论文作者建立卷积神经网络与PID控制器之间的联系,揭示了这种双分支网络可以等效于比例积分控制器,本质上也会遭受类似的超调问题。基于此,提出了一种基于PID控制器架构的三分支网络PIDNet,PIDNet在推理速度和准确度之间达到了最佳平衡,领先于所有现有模型(2023年)
2025-03-19 16:49:19
855
原创 深度学习PyTorch之数据加载DataLoader
数据加载是训练过程中的关键环节。高效的数据加载可以显著提升模型训练的效率和速度。在 PyTorch 中,DataLoader 是处理数据加载的核心工具,它提供了灵活的数据加载、批处理、数据增强等功能
2025-03-10 22:08:57
774
原创 ESPNetv2: A Light-weight, Power Efficient, and General Purpose Convolutional *原理解析与病虫害检测代码分享
ESPNetv2是ESPNet的优化,本博客解析其核心设计原理,揭示其如何通过深度可分离空洞卷积、分组逐点卷积和层次特征融合等技术突破传统网络的计算瓶颈。
2025-03-10 21:55:10
1017
原创 深度学习训练中GPU内存管理
在深度学习模型训练中,主流 GPU 显存通常为 8GB~80GB,内存不足会导致训练中断或 Batch Size 受限,GPU 内存管理是优化性能和避免 OutOfMemoryError 的关键挑战。本博客简介 PyTorch 中 GPU 内存管理的核心函数、用法和实战技巧,帮助开发者高效利用显存资源。
2025-03-08 09:00:00
1111
原创 Conda创建新环境等常用命令汇总
Conda 是一个流行的包管理器和环境管理工具,广泛应用于数据科学、机器学习等领域。它可以帮助我们管理 Python 包以及不同版本的环境,避免包冲突,提升项目的可复现性。以下是一些常用的 Conda 命令,涵盖环境创建、管理、包安装等常见操作。
2025-03-08 09:00:00
1171
原创 Polarized Self-Attention: Towards High-quality Pixel-wise Regression曾经屠榜的PSA极化注意力模型原理解析与代码分享
语义分割希望在处理高分辨率的图片时,能够捕捉到图片中不同部分之间的远距离关系,但是又不能让计算过程变得太复杂或者太费时,因此,提出了针对高质量像素级回归任务的自注意力机制--极化自注意力(PSA)机制。
2025-03-07 16:57:58
694
原创 SAM2-UNet: Segment Anything 2 Makes Strong Encoder for Natural and Medical Image Segment模型解析与代码分享
文章《SAM2-UNet: Segment Anything 2 Makes Strong Encoder for Natural and Medical Image Segmentation》提出了网络模型SAM2-UNet,在伪装物体检测、显著性检测、海洋动物分割、镜像检测、息肉分割应用,证明Segment Anything Model 2(SAM2)可以作为强大的编码器,用于通用图像分割。本博客对该模型进行解析。
2025-03-07 15:18:29
1807
3
原创 深度学习 PyTorch 中 18 种数据增强策略与实现
数据增强通过对训练数据进行多种变换,增加数据的多样性,它帮助我们提高模型的鲁棒性,并减少过拟合的风险。PyTorch 提供torchvision.transforms 模块丰富的数据增强操作,我们可以通过组合多种策略来实现复杂的增强效果。本文将介绍 18 种常用的图像数据增强策略,并展示如何使用 PyTorch 中的 torchvision.transforms 来实现这些策略。
2025-03-06 13:44:53
1380
原创 深度学习PyTorch之13种模型精度评估公式及调用方法
模型训练后需要评估模型性能,因此需要了解各种评估指标的具体用法和背后的数学原理,本博客以清晰的格式呈现**分类任务评估指标**的名称、调用示例、公式说明。
2025-03-06 13:14:26
1286
原创 CFPNet: Channel-wise Feature Pyramid for Real-Time Semantic Segmentation模型解析及代码实战分享
CFPNet(Channel-wise Feature Pyramid Network)是一种面向实时语义分割任务的高效网络结构,其**核心创新点在于提出了通道特征金字塔(CFP)模块**。该模块通过在通道维度上进行多尺度特征融合,显著提升了模型对多尺度目标的感知能力,同时保持了较低的计算复杂度。
2025-03-05 10:00:00
1287
原创 yolov12的cuda/cudnn/torch(torch-2.2.2+cu121-cp38-cp38-win_amd64.whl)/torchvision环境全安装包
最近yolov12已出,需要根据requirements.txt更新环境,此处通过百度云盘将对应文件存档。文件包括cuda_12.1.0_531.14_windows.exe、cudnn-windows-x86_64-8.9.7.29_cuda12-archive.zip、torch-2.2.2+cu121-cp38-cp38-win_amd64.whl和一个用于测试是否安装成功的py文件。
2025-03-05 09:52:53
592
原创 mmseg的decode_heads解析:理解语义分割解码器设计
在语义分割任务中,解码器(Decoder) 的设计直接影响模型对特征图的上采样能力和细节恢复效果。作为开源语义分割框架 mmsegmentation 的核心组件,decode_heads 提供了多种经典和前沿的解码器实现。本文将深入解析 mmseg 中常见的 decode_heads,包括其核心思想、结构设计、适用场景及代码实现,帮助读者全面掌握语义分割解码器的技术脉络。
2025-03-04 10:52:14
1003
原创 DIY损失函数--以自适应边界损失为例
深度学习中常涉及需要自定义损失函数的情况,本博客先介绍一种融合Diceloss和边界损失的损失函数原理,该融合损失函数在计算Dice系数时考虑了边界区域的信息,通过对交集部分加权,并以自适应计算的 $\alpha$ 调整边界区域和整体区域之间的贡献,从而优化了边界区域的分割精度;再通过代码创建,最后训练调用,以使读者掌握随时新创损失函数能力。
2025-03-04 10:27:35
1059
原创 FarSee-Net: Real-Time Semantic Segmentation模型解析及代码分享滑坡检测实战
论文《FarSee-Net: Real-Time Semantic Segmentation by Efficient Multi-scale Context Aggregation and Feature Space Super-resolution》原理解析及代码复现。
2025-03-03 13:11:44
1139
原创 深度学习pytorch之简单方法自定义9类卷积即插即用
本文详细解析了 PyTorch 中 torch.nn.Conv2d 的核心参数,通过代码示例演示了如何利用这一基础函数实现多种卷积操作。涵盖的卷积类型包括:标准卷积、逐点卷积(1x1 卷积)、非对称卷积(长宽不等的卷积核)、空洞卷积(扩大感受野)、深度卷积(逐通道滤波)、组卷积(分组独立处理)、深度可分离卷积(深度+逐点组合)、转置卷积(上采样)和动态卷积(动态生成卷积核),帮助读者理解如何通过调整参数灵活构建卷积层,适应不同任务需求。
2025-03-03 12:20:03
1115
原创 深度学习pytorch之4种归一化方法(Normalization)原理公式解析和参数使用
**归一化**(Normalization)是提升模型性能、加速训练的重要技巧。归一化方法可以帮助减少梯度消失或爆炸的问题,提升模型的收敛速度,且对最终模型的性能有显著影响。本文将以 PyTorch 为例,介绍4种常见的归一化方法:BatchNorm、Layer Norm、Instance Norm、Group Norm,并详细讲解它们的原理和公式。
2025-03-02 19:35:32
2028
原创 SegFormer: Simple and Efficient Design for Semantic Segmentation with Transformer *模型解析及滑坡语义分割实战
SegFormer 是一种基于 Transformer 的语义分割模型,通过结合 多尺度特征融合 和 轻量级解码器,在保持高效性的同时实现了高精度分割。其核心思想是利用 Transformer 提取全局上下文信息,并通过多级特征融合提升细节恢复能力。
2025-03-02 18:45:00
1122
原创 Lite-HRNet: A Lightweight High-Resolution Network原理解析及代码分享
论文《Lite-HRNet: A Lightweight High-Resolution Network》原理解析及代码复现。Lite-HRNet是针对实时语义分割任务优化的轻量级网络,其核心思想是在高分辨率特征保持与计算效率之间取得平衡。相比原版HRNet,通过引入多分辨率特征交互机制与通道重参数化技术。论文提出者用于人体姿态估计,本文将其用于语义分割训练,损失无法下降,基本全无法提取,本文仅作为结构学习记录
2025-03-01 17:35:27
1187
原创 基于PyQt5的简易薪酬管理系统纯代码开发解析
本文详细解析了如何使用PyQt5和SQLite开发一个轻量级薪酬管理系统。通过分步拆解核心代码,从界面布局、数据库连接到增删改查功能的实现,完整呈现桌面端数据库应用的开发流程。文章不仅提供基础功能实现,还包含数据验证、导出扩展等进阶技巧,并附有清晰的代码解释和运行流程图,帮助读者快速掌握PyQt5与SQLite的整合方法,为开发小型企业管理系统提供实践参考。
2025-03-01 17:32:24
508
原创 纯代码实战--用Deepseek+SQLite+Ollama搭建数据库助手
本博客手把手教学通过Python调用Deepseek大模型快速搭建智能薪酬问答系统,实现“说人话查数据”。通过整合Ollama大模型与SQLite数据库,开发了一个能理解自然语言、自动生成SQL、安全执行查询并给出人性化解读的AI助手。 文章详解三大核心模块——智能SQL生成器、安全查询引擎、结果解释器,讲解数据流转逻辑,给出大模型连接结构化数据的全链路开发示例。
2025-02-28 14:18:46
1804
原创 BiSeNet V2: Bilateral Network with Guided Aggregation for Real-time Semantic Segmentation原理解析及代码复现
BiSeNetv2是面向实时语义分割任务的高效网络架构,其核心设计理念是通过双分支结构实现细节特征与语义特征的协同优化。本博客是对论文《 BiSeNet V2: Bilateral Network with Guided Aggregation for Real-time Semantic Segmentation 》原理解析及代码复现。
2025-02-28 10:29:27
935
AI算法工程师手册
2018-12-06
基于pytorch实现的BiSeNet V2: Bilateral Network with Guided 可直接执行算法
2022-03-03
基于pytorch的Semantic Flow for Fast and Accurate Scene Parsing算法
2022-03-03
基于pytorch实现的ICCV2019HarDNet: A Low Memory Traffic Network算法
2022-03-03
支持中文路径和中文属性的编译好的gdal库
2019-04-24
机器学习判断是猫还是狗
2018-08-29
places205CNN_deploy30万次预训练模型caffemodel
2018-11-28
影像风格迁移.zip
2020-05-18
Python端QTdevelop影像查看小程序.zip
2021-07-21
tushare股票前复权数据获取及实现均线、kdj、macd等计算
2019-02-25
34findstartandend.py
2019-12-17
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人