- 博客(875)
- 资源 (1)
- 收藏
- 关注
原创 AI编程工具全景深度分析报告
安装激活:优先选择VS Code插件版,登录豆包账号即可免费解锁全部功能,无需额外付费。核心用法:针对机器视觉场景,通过「中文指令+垂直领域优化」可直接生成Halcon/OpenCV完整代码,大幅降低开发成本。进阶技巧:多文件分析、本地部署适配涉密项目,是工业视觉工程师的核心优势。如果需要,我可以为你生成一份MarsCode专属指令模板库(包含Halcon手眼标定、OpenCV图像拼接、C#工业通信等10+高频场景指令),直接复制即可生成生产级代码。
2026-03-11 10:23:52
495
原创 如何快速使用GPT-4o
入门首选:Cursor编辑器(无需额外配置,集成GPT-4o且适配代码开发,适合Halcon/OpenCV/PCL场景);快速验证:OpenAI网页版(支持多模态,可结合图片提问);定制化开发:API调用(集成到自有工具,批量生成代码);核心技巧:指令必须包含“版本+环境+业务约束”,复杂场景拆分模块,生成后重点校验内存、坐标系、旋转矩阵等核心参数。
2026-03-03 11:35:39
1181
1
原创 AI模型选择分析报告:Halcon、OpenCV(Python/C++)、PCL
摘要:本报告对比分析Halcon、OpenCV(Python/C++)和PCL三大机器视觉技术栈在AI模型生成代码时的表现。结果显示,GPT-4o在所有技术栈中表现最优(准确率65%-90%),尤其擅长Python环境;OpenCV Python支持度最高,PCL 3D点云开发难度最大。开发建议:生产级项目首选GPT-4o,基础补全用Copilot X,3D点云优先Python验证后转C++。关键提示:明确技术栈版本、拆分复杂模块、重点校验内存/类型/坐标系参数。
2026-03-03 11:34:03
562
原创 深入剖析 pip install -v -e . (Python 开发中高频使用的命令)
pip install -v -e . 是Python包开发的核心命令,用于以可编辑模式安装当前目录的包。参数解析:-v开启详细日志,-e创建软链接指向本地源码,实现修改后实时生效。与普通安装的区别在于不复制文件到site-packages,而是通过链接关联本地目录。使用前提包括:存在pyproject.toml/setup.py、安装构建工具、具备读写权限。适用场景为本地包开发和调试,生产环境禁用。验证方式可通过pip show查看本地路径或直接测试代码修改效果。常见问题多为缺失配置文件或权限不足。
2026-02-06 15:42:07
835
原创 python命令怎么停止运行
如何停止Python程序运行? 终端运行:交互式环境用exit()或quit()退出;运行脚本时按Ctrl + C强制停止。 IDE运行:直接点击红色停止按钮(如PyCharm、VS Code)。 后台进程:Windows用任务管理器结束进程,Mac/Linux用kill -9 PID终止。 核心方法:Ctrl + C停止脚本,exit()退出交互模式,IDE用可视化按钮,后台进程需手动终止。
2026-02-06 15:36:38
1040
原创 MMDetection3D 所有核心Backbone、Neck、数据集类型、完整模型算法详细剖析(超详细)
MMDetection3D是OpenMMLab生态中的3D感知框架,支持3D目标检测、语义分割和多模态感知。其核心模块包括: 1)Backbone:支持点云专用(PointNet++、PVCNN等)、图像复用(ResNet、SwinTransformer)和多模态融合(MVXBackbone、BEVBackbone)三类骨干网络; 2)Neck:提供点云专用(PointPillarsNeck等)和多模态融合(BEVFeatureExtractor等)特征融合模块; 3)Head:包含3D目标检测(Ancho
2026-02-05 14:13:55
1183
1
原创 MMDetection所有核心Backbone、Neck、数据集类型、完整模型算法详细剖析(超详细)
自定义数据集(如自己的缺陷/遥感/检测数据集)只需两步转换标注格式:将自定义标注(如txt/excel)转换为VOC/xml或COCO/json(推荐VOC,转换简单);修改配置文件:仅修改模板中的,其余参数无需改,直接运行。如果需要适配特殊场景# 1. 导入基类和注册器# 2. 注册模块(@MODELS.register_module() 必须加)# 定义注意力融合层# 定义卷积层])# inputs: Backbone 输出的多尺度特征图(如 [C3, C4, C5])# 注意力融合。
2026-02-05 11:27:53
1221
原创 MMSegmentation所有核心Backbone、Neck、数据集类型、完整模型算法详细剖析(超详细)
MMSeg的Backbone分CNN、Transformer、轻量级、分割专用四大类,覆盖从基础基线到SOTA高精度、从通用到轻量化部署的所有需求,其中HRNet/Swin/MixVisionTrans是当前主流;Neck是分割调优核心,分特征金字塔、空洞卷积、注意力增强、Transformer专用六大类,ASPP/PSPNeck/FPN是最通用的三大Neck,也是经典分割算法的核心组件;官方数据集覆盖通用、城市、医学、遥感、小样本、实时。
2026-02-05 10:46:30
714
原创 MMYolo 代码结构深度解析+自定义数据训练/测试全流程(超详细)
MMYolo是OpenMMLab生态中专注于YOLO系列目标检测的开源框架,基于模块化设计理念构建。本文从项目结构、训练流程和问题排查三个维度进行全面解析: 项目采用分层架构:核心代码封装在mmyolo/目录,所有参数配置集中在configs/,操作入口在tools/,训练成果保存在work_dirs/。新手只需修改配置并调用脚本,无需修改底层代码。 自定义数据训练全流程包括:按YOLO格式准备数据→编写配置文件→调用训练脚本→测试评估→模型推理。重点需注意数据格式转换和配置参数调整。 关键目录说明: co
2026-02-05 09:51:08
728
原创 MMCV版本不兼容AssertionError: MMCV==2.1.0 is used but incompatible. Please install mmcv>=2.0.0rc4.
摘要:在运行MMsegmentation时遇到MMCV版本不兼容问题,主要原因是未安装编译版mmcv-full。解决步骤包括:1)卸载现有mmcv/mmcv-full;2)根据PyTorch和CUDA版本安装对应mmcv-full(CPU/GPU版);3)升级mmengine;4)验证安装并重新训练。关键点是必须安装mmcv-full而非普通mmcv,且版本需与PyTorch/CUDA匹配。使用清华源可加速安装,在多Python环境下需确保使用正确的pip路径。
2026-02-05 09:34:56
910
原创 MMDetection 代码结构深度解析+自定义数据训练/测试全流程(超详细)
MMDetection框架解析与实战指南 摘要:本文深入解析OpenMMLab旗下MMDetection目标检测框架,从代码结构到工业落地全流程。重点剖析项目五大核心模块:根目录配置(环境安装/依赖管理)、底层功能包mmdet/(模型/数据/评估组件)、configs/配置中心、tools/操作脚本和demo/演示模块。特别说明检测任务特有要素:AP50评估指标、边界框可视化、YOLOX等模型配置。提供新手操作指南,包括work_dirs成果管理、最佳权重选择、报错排查技巧等。通过函数级代码解析和可运行脚本
2026-02-04 15:25:35
1199
原创 MMClassification 代码结构深度解析+自定义数据训练/测试全流程(超详细)
MMClassification是一个基于OpenMMLab生态的图像分类框架,采用配置驱动和模块化设计,无需修改底层代码即可实现全流程训练和部署。核心目录包括: 配置文件中心(configs/):包含模型、训练和数据参数设置 核心功能模块(mmcls/):封装数据加载、模型构建、训练引擎等底层逻辑 工具脚本(tools/):提供训练、测试和推理的快捷入口 工作目录(work_dirs/):自动保存训练日志、模型权重和评估结果 项目特点: 完全配置驱动,通过修改配置文件实现功能定制 模块高度解耦,支持灵活组
2026-02-04 09:41:22
1087
原创 MMSegmentation 代码结构深度解析+自定义数据训练/测试全流程(超详细)
MMSegmentation框架深度解析:从配置驱动到核心模块调用 摘要: 本文系统解析了OpenMMLab旗下MMSegmentation语义分割框架的核心结构与使用规范。框架采用配置驱动设计,通过配置文件定义功能,无需修改底层代码。重点剖析了: 根目录文件功能与操作禁忌:包括环境安装(setup.py)、依赖管理(requirements.txt)、训练结果存储(work_dirs)等核心文件的使用规范 核心功能模块调用链:详细拆解了mmseg/目录下的apis(训练/测试接口)、datasets(数据
2026-02-03 17:25:34
1163
原创 MMSegmentation(MMSeg)代码结构新手详解
本文详细介绍了MMSegmentation(MMSeg)的代码结构,旨在帮助新手快速掌握核心模块和使用方法。文章从整体代码框架入手,重点解析了根目录核心文件(如setup.py、requirements.txt)、mmseg核心功能模块(数据、模型、训练、评估等)以及配置文件的使用逻辑。针对新手常见场景(环境搭建、数据适配、模型训练),提供了具体操作建议和避坑指南,强调通过修改配置文件而非底层代码实现定制化需求。文中还标注了关键文件和参数的作用,帮助读者建立清晰的代码脉络,实现快速上手、问题定位和基础修改能
2026-02-03 16:10:18
1014
原创 MMSegmentation(MMSeg)代码结构超详细解析
MMSegmentation代码结构解析(MMSeg 2.x版本) 本文为新手提供MMSegmentation框架的极简代码结构解析,聚焦核心模块和实操要点: 核心目录结构 mmseg/:框架核心(模型/数据/训练逻辑) configs/:配置中心(通过修改配置定制训练) tools/ & demo/:训练/测试/推理脚本 data/ & work_dirs/:数据集和训练成果目录 关键模块功能 mmseg/models/:模型组件(骨干网络+分割头) mmseg/datasets/:数据加
2026-02-03 15:30:30
809
原创 PyTorch无CUDA支持**是导致程序崩溃的直接原因和解决方法
摘要 运行mmdetection推理脚本时出现两个问题:PyTorch无CUDA支持导致崩溃,权重文件键名不匹配产生警告。解决方案如下: 解决CUDA问题: 方法1:运行命令追加--device cpu使用CPU推理 方法2:修改代码默认设备为cpu 处理键名警告: 方式1:直接忽略(不影响运行) 方式2:修改配置文件添加_scope_='mmdet' 额外建议: 验证PyTorch是否支持CUDA 如需GPU推理,需安装CUDA版PyTorch GPU环境配置: 检查NVIDIA显卡和驱动版本 卸载CPU
2026-02-03 10:45:21
980
原创 MMCV与MMDetection版本不兼容的断言错误
摘要:出现MMCV与MMDetection版本不兼容错误(MMCV 2.2.0超出所需范围)。解决方法:1)卸载当前MMCV;2)安装兼容版本(推荐2.1.5),需匹配CUDA和PyTorch版本;3)验证安装。注意检查Python环境,后续建议使用mim install自动匹配版本。核心是确保MMCV版本在2.0.0rc4至2.2.0之间。(149字)
2026-02-03 09:04:31
697
原创 执行`mim run mmdet check_install`时报错,核心原因是**系统中未安装`mim`工具
摘要:执行mim run mmdet check_install报错的主要原因是未安装mim工具或环境变量配置不当。解决方案包括:1)验证Python/pip环境;2)使用python -m pip install -U openmim安装工具;3)通过python -m mim调用命令或配置Scripts目录环境变量;4)用mim install mmdet自动解决依赖问题。关键注意Python版本兼容性(建议3.8-3.11)和环境变量生效需重启终端。该方法可确保MMDet环境检查顺利执行。(149字)
2026-02-03 09:00:02
982
原创 开源计算机视觉算法体系OpenMMLab的使用方法
OpenMMLab是一个基于配置文件驱动的开源计算机视觉算法体系,包含目标检测(MMDetection)、图像分类(MMClassification)等子库。核心使用步骤包括:1)安装PyTorch和CUDA;2)安装基础库MMEngine和MMCV;3)选择子库如MMDetection进行安装。使用流程为:通过配置文件定义模型参数,支持快速推理、模型评估和训练。例如在MMDetection中,可加载预训练模型进行目标检测,或在COCO数据集上训练自定义模型。该系统设计统一,便于迁移到其他视觉任务,适合从新
2026-02-02 17:28:41
763
原创 开源算法体系OpenMMLab
OpenMMLab是中国主导的国际知名计算机视觉开源项目体系,包含覆盖多种视觉任务的算法库,如目标检测(MMDetection)、文字识别(MMOCR)、3D检测(MMDetection3D)、图像分割(MMSegmentation)、姿态估计(MMPose)等。该项目提供从训练到部署的全流程解决方案,支持PC、移动设备、嵌入式系统等多种硬件平台。模型部署工具箱MMDeploy专门解决终端设备算力有限、芯片异构等挑战,实现高效推理。OpenMMLab已成为计算机视觉领域的重要开源基础设施。
2026-02-02 17:16:12
659
原创 轻松搞定transformer模型原理及代码
Transformer是一种基于注意力机制的序列建模架构,彻底解决了传统RNN和CNN在长距离依赖和并行计算上的痛点。其核心创新包括自注意力机制、多头注意力、位置编码和编码器-解码器架构。编码器通过多头自注意力层和前馈网络层生成全局语义特征,解码器则基于这些特征自回归生成目标序列。位置编码通过正弦余弦函数注入顺序信息,残差连接和层归一化确保训练稳定性。Transformer在翻译任务中表现优异,并为BERT、GPT等大模型奠定了基础,成为NLP领域的里程碑式突破。
2026-02-02 11:41:04
1251
原创 AI计算机视觉(CV)领域的算法模型架构
本文系统梳理了AI计算机视觉(CV)领域的算法架构和发展趋势。算法部分涵盖传统机器学习(SIFT、HOG等)、CNN(ResNet、YOLO等)、Transformer(ViT、Swin等)、时序模型(LSTM、3D CNN)、生成模型(GAN、扩散模型)以及多模态融合(CLIP、BEV)等八大类别,分析了各自的技术特点和应用场景。未来趋势方面,重点展望了多模态融合、CNN-Transformer混合架构、3D视觉、轻量化部署、可信AI和具身智能六大方向,指出CV技术正从感知向认知升级,在医疗、工业、自动驾
2026-02-02 10:46:29
917
原创 Transformer模型全面详解(计算机视觉领域原理、算法、应用场景)
Transformer模型在计算机视觉领域的核心创新在于将图像视为序列数据,通过自注意力机制实现全局特征关联,克服了传统CNN的局部依赖局限。本文系统梳理了CV-Transformer的技术体系,包括基础架构(如ViT、Swin Transformer)和任务专用模型(如DETR、SegFormer)。重点解析了图像分块、位置编码、自注意力计算等关键技术,并分析了其在图像分类、目标检测、工业视觉等场景的应用优势。文章还探讨了Transformer的并行计算、长距离依赖捕捉等核心优势,以及计算复杂度高、小样本
2026-02-02 09:45:20
1300
原创 Transformer模型原理全面详解(通俗易懂)
Transformer模型通过自注意力机制实现了序列数据的并行处理,解决了传统RNN/LSTM的串行计算和长距离依赖问题。其核心是多头自注意力层,让模型能同时关注输入中不同位置的关联信息。编码器-解码器结构配合位置编码,使Transformer在机器翻译等任务中表现出色,支持并行计算并有效捕捉长距离关系。这种设计使其成为当前大语言模型的基础,广泛应用于NLP、图像生成等领域。Transformer的突破性在于用注意力机制替代了序列依赖的递归计算,大幅提升了模型效率和表现力。
2026-02-02 09:18:25
1443
1
原创 手眼标定核心内容详解
手眼标定是建立机器视觉系统与机械执行机构坐标映射关系的关键技术,主要分为眼在手上(Eye-in-Hand)和眼在手外(Eye-to-Hand)两种模式。核心数学模型采用AX=XB方程描述位姿关系,通过多组数据采集和最小二乘法求解转换矩阵。常用标定方法包括高精度的Halcon标定板标定、简化的九点标定、开源的张氏标定法以及双目视觉标定,需根据精度需求和场景特点选择适配方案。2D应用中位姿数据简化为平面平移和Z轴旋转,需进行有效性验证和格式转换。标定结果以4×4齐次矩阵存储,调用时需结合畸变校正和误差补偿,确保
2026-01-28 09:48:27
904
原创 多相机无重叠区域的坐标系统一(大标定板歪斜情况下的精确物理坐标获取)
摘要: 针对标定板歪斜导致X/Y轴非正交的问题,提出基于单应性变换的精确物理坐标获取方案。通过4个以上已知物理坐标的参考点,计算图像到物理坐标的单应性矩阵(Homography),实现任意投影变形的校正。方案提供C++(OpenCV)和C#(OpenCvSharp)实现,核心流程包括:1)选取参考点;2)提取图像坐标;3)计算单应性矩阵;4)坐标转换;5)精度验证(要求RMSE<0.1mm)。完整工作流程涵盖标定板制备、图像采集和特征点提取,确保在非理想条件下仍能获得亚毫米级精度的物理坐标。
2026-01-26 15:51:10
686
原创 【OpenCV 核心算子全详解】-图像拼接(特征提取、特征匹配、旋转估计、自动校准、图像变换、接缝估计、曝光补偿、图像混合)
本文摘要介绍了OpenCV图像拼接模块的核心组件,主要包含7个功能模块:1) 特征查找与图像匹配(特征提取、匹配器实现及数据结构);2) 旋转估计(自动波校正、图优化与相机参数调整);3) 自动校准(焦距估计与旋转相机校准);4) 图像变换(Warper基类与具体实现);5) 接缝估计(多种接缝查找算法);6) 曝光补偿(块补偿与通道补偿策略);7) 图像混合(拉普拉斯金字塔融合与权重处理)。各模块通过基类定义接口,派生类实现具体算法,形成完整的图像拼接流水线。
2026-01-20 17:08:14
393
原创 【OpenCV 核心算子全详解】-特征检测与匹配(特征描述符、关键点、对象分类、硬件加速)
(如替代K-Means的DBSCAN、层次聚类等),默认场景直接使用。
2026-01-20 16:41:19
413
原创 【OpenCV 核心算子全详解】-高级 GUI模块(窗口创建、窗口属性、交互控制、回调函数)
OpenCV HighGUI模块摘要 HighGUI模块提供图像显示和交互功能,主要包括: 窗口管理:创建/销毁窗口(namedWindow/destroyWindow),设置窗口属性(大小、标题、位置等) 图像显示:imshow函数显示图像,支持Mat和OpenGL纹理 交互控制: 轨迹栏(Trackbar):创建滑动条控件 鼠标操作:设置鼠标回调 键盘操作:waitKey获取按键输入 高级功能: ROI选择(selectROI) OpenGL交互支持 Qt扩展功能(按钮、状态栏等) 辅助工具:窗口线程管
2026-01-20 16:15:41
452
原创 【OpenCV 核心算子全详解】-图像文件读写(能力检查、数量统计、内存编解码、文件读写、iOS 格式转换)
本文详细介绍了OpenCV中图像读写及格式转换的核心算子,包括图像读写能力检查(cv::haveImageReader/cv::haveImageWriter)、图像数量统计(cv::imcount)、内存缓冲区编解码(cv::imdecode/cv::imencode系列)以及文件读写函数(cv::imread/cv::imwrite系列)。此外,还涵盖iOS平台的图像格式转换工具(如CGImage与Mat互转)。通过参数详解和代码示例,帮助开发者快速掌握OpenCV图像处理的基础操作,适用于本地文件、内
2026-01-20 16:03:16
410
原创 【OpenCV 核心算子全详解】-核心函数(数组操作、聚类、异步 API、XML/YAML/JSON、硬件加速、并行处理等)
本文摘要总结了OpenCV核心数据结构类及其功能特性。主要包括输入/输出数组代理类(_InputArray、_OutputArray等)、基础数据结构(Mat、Matx、KeyPoint等)、算法基类(Algorithm)以及辅助工具类(DataType、MatIterator等)。这些类提供了图像处理、矩阵运算、特征匹配等功能的统一接口,支持自动内存管理、类型安全和高效运算。关键类如Mat用于多维数组存储,KeyPoint描述特征点信息,Algorithm作为算法基类支持参数配置和序列化。这些数据结构构成
2026-01-20 15:43:55
581
原创 【OpenCV 核心算子全详解】-相机校准和 3D 重建(相机标定、立体视觉、位姿估计、畸变校正)
你提供的这些OpenCV函数均属于相机标定、立体视觉、位姿估计、畸变校正 核心模块,覆盖了从单目/双目相机标定到3D位姿求解、手眼标定、视差计算等全流程。下面按功能分类,详细解析每个函数的功能、参数含义、使用场景,确保无遗漏且通俗易懂。从多张标定板(如棋盘格)图像中求解单目相机内参、畸变系数,以及每张图像对应的相机外参(旋转向量rvecs、平移向量tvecs),返回重投影误差的均方根值。重载2:带误差分析的版本参数详解 可选值(常用)::固定内参,仅优化外参(适用于已标定内参的场景);:固定
2026-01-20 14:46:08
1118
原创 【OpenCV 核心算子全详解】-图像处理系列(滤波、几何变换、绘图、色彩转换、直方图、特征检测、图像分割等)
本文全面解析了OpenCV核心图像处理算子,涵盖滤波、形态学、金字塔等核心模块。重点介绍了双边滤波、盒滤波、高斯金字塔等常用算子,详细说明其功能、参数和使用场景。双边滤波可实现保边去噪,盒滤波提供快速平滑处理,高斯金字塔支持多尺度分析。此外还讲解了形态学操作(膨胀/腐蚀)、自定义卷积滤波(filter2D)以及核生成函数(如Gabor核)。这些算子是图像预处理、特征提取和分割任务的基础工具,掌握其原理和参数配置对计算机视觉应用开发至关重要。
2026-01-20 14:39:03
1015
原创 OpenCV 算子速查手册(覆盖99%的OpenCV开发需求)
OpenCV算子速查手册(精简版) 本手册精选OpenCV高频算子,按实际开发场景分类: 相机标定: 核心:findChessboardCornersSB、calibrateCamera、stereoCalibrate 辅助:cornerSubPix、undistort 图像预处理: 核心:GaussianBlur、threshold、morphologyEx 辅助:CLAHE、filter2D 特征检测: 核心:Canny、goodFeaturesToTrack、HoughLinesP 辅助:corner
2026-01-20 14:32:54
783
原创 相机标定内参与外参超级全面详解(内参矩阵、径向/切向畸变、薄棱镜畸变(S1-S4)、物理焦距、FOV视野、外参旋转/平移XYZ分解)
本文系统阐述了相机标定的核心理论与工程实践,重点解析了内参(固有参数)和外参(位姿参数)的数学建模与物理本质。主要内容包括: 四大坐标系(世界/相机/图像物理/像素)的转换关系,以及齐次坐标的数学基础; 内参矩阵(K矩阵)各元素的物理意义与工程影响,包括焦距(fx,fy)、主点(cx,cy)和倾斜因子(γ); 畸变模型详细解析,涵盖径向畸变(k1,k2,k3)和切向畸变(p1,p2)的矫正方法; 参数间的物理关联,如通过像素焦距反推物理焦距的公式。 全文构建了从理论基础到工程落地的完整体系,为计算机视觉中的
2026-01-20 13:26:08
1580
原创 薄棱镜畸变系数S1-S4 深度解析:物理本质、数学模型、应用场景
摘要:薄棱镜畸变系数$S_1$-$S_4$用于描述镜头偏心导致的非对称光学畸变,是高精度相机标定的关键参数。其物理本质源于镜片偏心、装配偏差或传感器错位,表现为非对称畸变,区别于传统径向/切向畸变的对称特性。数学模型通过加法修正实现矫正,需在径向和切向畸变矫正后执行。适用场景包括低成本镜头、工业偏差设备及鱼眼镜头等高畸变系统,而高精度工业镜头或低精度应用可禁用以避免过拟合。OpenCV中通过CALIB_RATIONAL_MODEL标志启用高阶标定求解$S_1$-$S_4$。
2026-01-20 13:09:18
746
原创 【tensorRT从零起步高性能部署】23-TensorRT基础-ONNX文件及其结构的编辑修改
ONNX(Open Neural Network Exchange)是一种跨框架、跨硬件的神经网络中间表示格式,作为AI模型部署的"通用货币"。文章详细介绍了ONNX的核心概念和操作流程:1)通过PyTorch示例演示如何导出ONNX模型,包括动态维度配置和可视化检查;2)解析ONNX的Protobuf底层结构,说明其与onnx-ml.proto文件的关系;3)提供ONNX模型的读取和验证方法,包括权重提取和合法性检查。ONNX通过标准化模型表示,简化了从训练框架到推理引擎的转换过程,是
2026-01-19 17:05:24
884
原创 【tensorRT从零起步高性能部署】22-TensorRT基础-模型推理动态shape
摘要: 动态Shape功能解决了模型推理时输入尺寸不固定的问题,通过编译时指定维度范围(如3x3~5x5),使模型能在范围内适配任意尺寸输入。实现关键包括:1)用-1标记动态维度(如Dims4(-1,1,-1,-1));2)配置Optimization Profile定义最小/最优/最大尺寸范围(如kMIN(1,1,3,3)、kMAX(10,1,5,5))。典型流程为构建网络→设置动态维度→编译生成engine→推理时灵活调整尺寸,适用于图像分割等需处理变长输入的场景。
2026-01-19 16:30:25
828
原创 【tensorRT从零起步高性能部署】21-TensorRT基础-实现模型的推理过程
本文详细讲解了使用TensorRT进行模型推理的全流程实现。通过C++代码示例,展示了从加载预训练模型到执行推理的完整过程,包括:1) 创建运行时并反序列化模型;2) 创建执行上下文和CUDA流;3) 准备输入数据并传输至GPU;4) 执行推理并获取结果;5) 释放资源;6) 手动验证计算结果。文中特别强调了关键概念如IRuntime(模型加载器)、ICudaEngine(可执行模型)和IExecutionContext(执行环境)的作用,并解释了CUDA流对异步处理的重要性。最后通过手动计算验证了推理结果
2026-01-16 15:50:44
362
原创 【tensorRT从零起步高性能部署】20-TensorRT基础-第一个trt程序,实现模型编译的过程
这个案例是TensorRT的「入门敲门砖」,核心目标不是实现复杂功能,而是掌握TensorRT构建模型的4个核心步骤,理解builderconfignetworkengine这些核心组件的作用,为后续YOLO等复杂模型的高性能部署打基础。简单说:这个案例就是教你「用TensorRT的C++ API,把一个极简的神经网络(输入→全连接→Sigmoid→输出)从「设计图」变成「可运行的优化模型文件」」。// tensorRT核心头文件:构建模型、运行时推理// CUDA头文件:TRT依赖CUDA运行。
2026-01-16 11:23:34
495
桌面开发 - WeifenLuo.WinFormsUI.Docking-3.1.0 版本 - WinForms 停靠控件库 - 用于窗口布局与交互管理
2025-08-20
桌面开发 - WPF UI - 组件库wpfui-main - 用于 WPF 应用程序的现代化界面设计与开发
2025-08-20
机器视觉 - HalconHelper - 辅助工具 - 用于 Halcon 视觉开发效率提升与代码辅助
2025-08-20
CHM 制作精灵是一款功能强大的国产 CHM 电子图书处理软件
2025-08-20
深度学习 - cudnn-windows-x86-64-9.8.0.87-cuda12-archi - Windows x86-64 平台适配 - CUDA 12 加速库 - 用于深度神经网络计算加速
2025-08-20
深度学习 - cudnn-windows-x86-64-9.8.0.87-cuda11-archi - Windows x86-64 平台适配 - CUDA 11 加速库 - 用于深度神经网络计算加速
2025-08-20
深度学习 - cudnn-windows-x86-64-8.7.0.84-cuda11-archi - Windows x86-64 平台适配 - CUDA 11 加速库 - 用于深度神经网络计算加速
2025-08-20
机器视觉 - HALCON-DeepLearningTool 工具 - 用于深度学习视觉检测模型开发与部署
2025-08-20
系统工具 - 向日葵远程控制 - 11.0.0.33162 版本 - 用于远程桌面管理与设备控制
2025-08-20
软件开发 - VS Code-1.48.2 版本 - x64 用户安装包 - 用于代码编辑与开发环境搭建
2025-08-20
计算机视觉 - SeetaFace-6.0 版本 - Windows 平台 - 用于人脸检测与识别开发
2025-08-20
软件开发 - Notepad++-7.9.3 版本 - 轻量级文本编辑器 - 用于代码编辑与文本处理
2025-08-20
图形图像 - FastStone Capture - 专业截图工具 - 用于屏幕捕获与图像编辑处理
2025-08-20
CMake-4.0.2 版本 - Windows x86-64 平台安装包 - 用于跨平台项目构建与编译配置
2025-08-20
深度学习 - YOLOv8-TensorRT 部署yolov8-tensorrt-main - 项目工程 - 用于目标检测模型的高效推理部署
2025-08-20
计算机视觉 - OpenCV4.9.0(GPU版本) - GPU 加速版 - 用于图像处理与计算机视觉任务加速
2025-08-20
7Z .exe - 可执行文件 - 用于文件压缩与解压缩操作
2025-08-20
OBS免费录屏直播软件
2025-06-03
一款基于SAM的交互式半自动图像分割标注工具
2025-06-03
五子棋源码(采用木纹棋盘风格,棋子有阴影和渐变效果,界面层次分明)
2025-08-20
进阶版贪吃蛇游戏(每吃一个食物速度增加并改变颜色,蛇身使用渐变色圆角矩形,食物是旋转的星星,有背景网格线和分数显示)
2025-08-20
流媒体处理 - OBS Studio-master - 开源直播与录屏软件 - 用于实时视频采集、编辑与推流
2025-08-20
深度学习 - onnx-tensorrt-master-ONNX 到 TensorRT 的转换工具 - 用于模型格式转换与推理加速
2025-08-20
计算机视觉 -OpenCvSharp-main-.NET平台的 OpenCV 封装库 - 用于 C#/VB.NET图像处理与视觉开发
2025-08-20
深度学习 - TensorRT-Pro-main - 项目工程 tensorRT-Pro-main- 用于多框架模型的 TensorRT 高效部署与优化
2025-08-20
计算机图形学 - VTK-9.3.0 版本VTK9.3.0-main - C++ 3D 可视化库 - 用于三维图形处理与可视化开发
2025-08-20
Rust 系统编程实战:文件系统分析工具
2025-08-20
Docker 部署实战项目:Flask + MySQL 应用
2025-08-20
实时物体跟踪(opencv+python)
2025-08-20
学生成绩管理系统(C语言)
2025-08-20
待办事项功能源码(HTML+CSS+JavaScript)
2025-08-20
计算机视觉 - sam-main - 图像分割模型项目 - 用于实现 Segment Anything Model (SAM) 的部署与应用
2025-08-20
C#winform图像批量格式转换
2025-08-20
深度学习 - infer-main - 推理部署项目工程 - 用于深度学习模型的高效推理与集成
2025-08-20
三维数据处理 - Open3D-main - 开源库 - 用于三维点云、网格与 RGBD 图像的处理与可视化
2025-08-20
3D点云处理 - PCL-master-C++ 开源库 - 用于三维点云数据处理与分析
2025-08-20
图形编程 - STNodeEditor-main - 节点编辑器框架 - 用于可视化流程图与节点式交互系统开发
2025-08-20
深度学习 - TensorRT-master - 官方开源项目 -tensorrt-master- 用于深度学习模型推理加速引擎开发与部署
2025-08-20
深度学习 - TensorRTx - 项目工程-tensorrtx-master - 用于主流深度学习模型的 TensorRT 加速部署
2025-08-20
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅