- 博客(518)
- 资源 (29)
- 收藏
- 关注
原创 ONNX模型多线程推理并解决线程踩踏与显存溢出问题
本文提出了一种基于多线程队列的实时视频处理架构,解决了模型推理速度跟不上摄像头采集速度导致的丢帧问题。系统采用三个核心队列(待处理队列、结果队列、记录队列)实现异步处理,配合线程池加速推理过程。针对多线程保存图像时的冲突问题,设计了生产者-消费者模式,通过专用保存线程有序处理图像存储任务。实验表明该方法能有效提升处理效率,CPU利用率保持稳定,同时避免了多线程环境下的图像写入冲突。系统框架具有通用性,可应用于各类需要实时视频分析的场景。
2026-04-23 17:02:45
240
原创 千人千面无人考评系统
摘要:本文介绍了重构后的无人考评系统架构,该系统采用多模态AI技术实现自动化安规考核。核心技术包括YOLO-Pose姿态检测、YOLO11装备识别、ResNet细粒度分类等算法,结合PyQt6界面和SQLite数据库。系统流程涵盖身份核验、项目选择、实时考评(动作分析、装备检测)和结果可视化等功能,提供全流程自动化考核解决方案,具有高准确性和低延迟特性。
2026-04-16 12:44:46
358
原创 SenseVoice多语言语音理解模型教程
阿里巴巴推出的SenseVoice-Small是一款高效的多语言语音理解模型,具备快速推理能力(10秒音频仅需70毫秒)和卓越的语音识别性能。该模型采用非自回归端到端架构,速度比同类产品快7-15倍,支持多语言识别、情感分析和音频事件检测。使用方式简单,通过Python代码即可实现语音转文字功能,并支持自动下载模型文件。其特色功能包括语音活动检测(VAD)和丰富的后处理选项,适用于实时语音交互场景。模型文件默认存储在用户缓存目录,提供开箱即用的语音处理解决方案。
2026-04-15 11:01:30
63
原创 基于计算机视觉的运动计数与饮食热量分析系统
摘要:博主在原有YOLO饮食热量计算系统基础上,结合YOLOPose姿态估计技术,开发了"基于计算机视觉的运动计数与饮食热量分析系统"。新系统不仅能识别菜品并计算热量,还新增了运动监测功能,可精准统计俯卧撑、深蹲等健身动作次数。系统提供完整的解决方案,包括菜品识别、热量计算、运动视频分析、数据记录和用户管理等功能,实现了饮食健康与运动管理的智能化结合。
2026-03-29 14:22:15
83
原创 基于计算机视觉的智能餐饮热量监测与结算系统设计与实现
本文设计了一种基于YOLO目标检测的智能餐饮热量监测与结算系统。系统采用"视觉分类识别+标准化营养数据库+混合计费逻辑"架构,通过YOLO算法实时识别72类菜品,结合预置营养数据库实现热量和营养素精准查询。创新性地设计了固定份量与按重计费双模式结算机制,有效解决了不同场景下的计价难题。实验表明,该系统在降低硬件成本的同时,显著提升了营养数据透明度和结算效率。未来将扩展数据库覆盖范围,探索个性化健康管理功能。该系统为智慧餐饮提供了高效、低成本的解决方案。
2026-03-24 22:14:51
552
原创 基于PaddleSeg与YOLO的自动标注工具
本文介绍了一套智能交互式标注系统,旨在解决深度学习项目中数据标注成本高、周期长的问题。系统采用人机协同方式,用户完成少量初始标注后,系统可自动训练模型并辅助后续标注。支持语义分割(基于PaddleSeg框架,适配UNet、SegFormer等模型)和目标检测(集成YOLO系列算法),提供手动绘制和自动标注功能,允许对标注结果进行交互式微调。系统还包含数据格式转换(JSON转YOLO格式)和数据集划分功能,标注结果兼容LabelMe格式,显著提升标注效率。
2026-03-16 23:40:23
99
原创 SegFormer:遥感卫星影像语义分割之神
本文对比了YOLO-Seg和SegFormer在遥感影像分割中的表现。实验发现,基于Transformer架构的SegFormer在处理大范围背景干扰和模糊边界时效果显著优于CNN架构的YOLO-Seg。分析表明,SegFormer的全局自注意力机制使其具备更强的上下文理解能力,能准确建模地物间的空间关系,而YOLO-Seg更适合实时实例分割任务。在需要高精度的遥感语义分割场景下,SegFormer在分割精度、边缘完整性和抗干扰能力上优势明显。该研究为遥感影像处理提供了有效的模型选择参考。
2026-03-04 11:27:20
369
原创 千人千面考核系统设计总结
最近,完成了一个千人千面安规考核系统的开发,该系统采用进行封装,利用姿态估计、人脸识别、目标检测等深度学习算法进行安规动作考评,效果如下:接下来,博主将根据技术栈进行系统介绍:整个系统使用进行开发,功能如下:首页人脸识别是一种通过分析人脸图像或视频来识别个体身份的技术,其基本原理可以分为以下几个关键步骤:人脸检测 (Face Detection):首先,系统需要在图像或视频流中找到人脸的位置。这通常通过检测人脸的轮廓、五官(如眼睛、鼻子、嘴巴)的相对位置和特征来实现,将人脸区域从背景中分割出来,并用一个矩
2026-03-04 11:03:09
441
原创 YOLO-seg训练LoveDa数据集
本文介绍了如何将LoveDA遥感数据集转换为YOLOv8-Seg模型所需的格式。LoveDA包含5,987张0.3米分辨率影像,涵盖7类地物。针对建筑物和水体识别任务,作者设计了类别映射方案(建筑物→0,水体→1),并开发了Python转换脚本,通过轮廓提取将单通道掩码转为YOLO格式的txt文件。该方法有效解决了原始标注格式与目标模型要求不匹配的问题,同时处理了类别过滤和坐标归一化等关键步骤。转换后的数据可直接用于YOLOv8-Seg模型的训练与评估。
2026-02-11 17:09:19
449
原创 PaddleSeg转换为ONNX后精度丢失改进方法
后,其结果发生了明显下降,经过分析,发现可能是其预处理过程中的。但这个方法也并不完美,最好是我们在训练时便指定好。这样,我们重新训练后,其结果就好很多了。的语义分割模型转换为。
2026-02-06 14:31:17
114
原创 PaddleSeg训练遥感数据集并转换为ONNX部署
要对遥感图像实现语义分割,先前使用YOLO-seg,但效果不太理想,几经探索,锁定了PaddleSeg语义分割框架,其内整合了多个语义分割模型,这里我们便使用其完成从数据标注,到模型部署整个流程。
2026-02-06 13:39:47
102
原创 YOLO26 :真正实现端到端预测
众所周知,YOLO系列模型在推理过程中会对图像中的每个目标生成大量重叠或高度相似的预测框。这种“一对多”()的预测机制虽然有助于提升召回率和训练稳定性,但也不可避免地引入了大量冗余检测框——即多个边界框同时指向同一个真实目标。若不加以处理,这些重复预测将严重影响检测结果的准确性和实用性。因此,在传统YOLO模型的后处理流程中,必须引入非极大值抑制()算法,对置信度较低或与高分框重叠度过高的预测进行过滤,仅保留最优的检测结果。然而,NMS不仅增加了推理延迟,其超参数(如IoU。
2026-01-25 16:22:37
1414
2
原创 航线工程Tower与验证照片数量对比工具
本文介绍了一款针对拓维斯软件的航线工程杆塔核查工具。该工具通过自动比对系统杆塔列表与实际拍摄照片,解决了传统人工核对效率低、易出错的问题。特别适用于含上百基杆塔的大型项目,能快速识别漏拍杆塔,显著提升核查效率和准确性。文中展示了工具操作界面和比对效果,为电力巡检项目提供了高效的质量控制解决方案。
2025-09-11 20:36:37
307
原创 Mid-360 雷达获取数据并使用 Open3d+python 进行可视化
摘要 本文介绍了Mid-360雷达的连接与数据采集方法。首先通过Livox航插线连接雷达与主机,配置IP地址为192.168.1.50,使用Livox Viewer软件查看点云数据。随后通过Python程序接收UDP数据包,解析点云数据。Mid-360支持三种数据类型,默认为32bit直角坐标系格式,每个点包含14字节数据(X/Y/Z坐标、反射率和标签)。程序通过socket接收数据,解析后存储为点云坐标和属性信息,实现实时点云采集功能。
2025-09-03 11:27:05
766
原创 Jetson进行旋转目标检测推理实现大疆无人机飞行控制
本文介绍了大疆PSDK的源码结构,重点分析了基于YOLOv8的旋转目标检测类Yolov8Obb的实现。PSDK源码包含核心库、示例代码和工具,其中C++示例代码是主要开发区域。Yolov8Obb类提供了模型加载(ReadModel)和目标检测(Detect)两个核心方法,支持GPU加速推理,能够输出包含类别、置信度、旋转框等信息的检测结果。该实现利用OpenCV的DNN模块,通过预处理、网络推理和后处理流程完成旋转目标检测任务,适用于无人机载荷开发中的视觉分析需求。
2025-08-29 18:50:17
1179
1
原创 Jetson 开发板烧录 JetPack6.2 系统
本文详细介绍了在Ubuntu系统上安装NVIDIA Jetson开发环境的完整流程。首先从官网下载Ubuntu 22.04镜像并制作启动U盘,完成系统安装。然后下载NVIDIA SDK Manager工具,通过该工具识别Jetson Orin NX 8GB硬件并安装JetPack 2.1系统镜像。安装过程中需要登录NVIDIA账号,并设置开发板用户名密码。最后退出烧录模式,连接显示器即可进入Jetson系统。文章提供了各步骤的截图和下载链接,指导用户完成从Ubuntu系统安装到Jetson开发环境配置的全过
2025-08-08 14:59:13
1132
1
原创 大疆无人机使用eport连接Jetson主板实现目标检测
本文详细介绍了在Jetson边缘计算主板上配置无人机导线追踪系统环境的过程。主要内容包括:更新软件库、安装Opus音频编解码器、FFmpeg多媒体框架、配置OpenCV/CUDA/cudNN推理环境,以及安装USB通信驱动。重点阐述了如何设置系统开机自启服务,包括djixunxian.service和jetsongadget.service的部署与启动,并提供了项目编译和常见错误解决方案。当出现USB设备无法识别时,可通过安装CH34驱动解决。最后展示了系统成功运行时的推理效果截图,验证了环境配置的正确性。
2025-08-06 22:23:43
2324
1
原创 智能安规考核系统:AI(YOLO+讯飞语音)赋能千人千面
摘要 "千人千面智能安规考核系统"是一款基于PyQt5框架开发的智能化安全规程考核平台,融合了YOLOPose姿态估计、人脸识别、YOLOv11目标检测和语音识别等多模态AI技术。系统通过ONNX格式实现模型轻量化部署,利用ONNX Runtime和GPU加速提升性能,并打包为独立可执行程序便于工业现场部署。该系统可自动评估安全装备佩戴、操作规范等指标,实现了电力、建筑等行业安全考核的智能化与个性化。 关键特性: 多模态AI评估体系 跨平台ONNX模型部署 实时性能优化 一体化考核解决方
2025-07-30 14:17:06
3155
原创 Jetson边缘计算主板:Ubuntu 环境配置 CUDA 与 cudNN 推理环境 + OpenCV 与 C++ 进行目标分类
摘要:本文详细记录了在Jetson Orin NX 16GB上配置AI开发环境的过程。首先安装jtop监测工具,然后通过Jetpack套件自动安装CUDA和cuDNN,并进行环境变量配置。接着测试cuDNN功能,最后编译支持CUDA加速的OpenCV 4.13版本(需配合opencv_contrib模块)。文中提供了完整的命令行操作和常见问题解决方案,为在Arm架构的Jetson设备上部署AI模型提供了实用指南。
2025-07-03 10:39:48
1954
原创 Linux环境下使用 C++ 与 OpenCV 实现 ONNX 分类模型推理
本文详细介绍了在Ubuntu 20.04系统上使用C++和OpenCV加载ONNX分类模型的完整流程。内容包括:1) 安装必要依赖项;2) 通过源码或GitHub下载安装OpenCV 4.9.0;3) CMake配置与编译OpenCV;4) 配置pkg-config环境和动态库路径;5) 测试代码示例,展示了如何使用OpenCV的dnn模块加载ONNX模型并进行图像分类推理。文中提供了关键命令和配置步骤,包括环境变量设置、pkgconfig路径修改等,最终成功运行分类模型并输出top-5预测结果。
2025-07-02 14:28:31
931
原创 讯飞大模型实时语音识别
默认是1024B,每40毫秒发送一次,经过博主测试,可以稳定在4096B,10毫秒的处理速度。至于识别精度,说实话,一言难尽,这个实时的识别效果比起上传读取音频的识别效果要差很多。不过毕竟它能够实现一个实时效果,就看大家如何选择了。
2025-07-01 17:53:00
691
原创 讯飞方言识别大模型python调用
摘要:本文介绍了如何使用讯飞方言大模型进行方言识别,针对官方Python接口存在的问题进行了改进。作者通过将音频分段处理,先检测静音片段,再合并非静音部分进行识别,提升了识别效率。代码实现了音频分割、静音检测、片段合并功能,并展示了与讯飞WebSocket API的交互方法,包括鉴权参数生成和消息处理。改进后的方案优化了长音频处理流程,减少了无效识别,提高了整体识别速度。
2025-06-27 08:53:07
687
原创 YOLO+ONNX+PyQt打包为exe踩坑记录
摘要:博主开发了一款实时姿态估计和目标检测软件,最初使用PyTorch+PyQt方案导致打包文件过大(2.7G),后改用ONNXRuntime推理模型优化体积。在Python 3.8环境下成功打包时,发现缺少onnxruntime_providers_shared.dll依赖,通过修改spec文件添加依赖项和资源文件路径后解决。最终使用PyInstaller完成打包,生成的可执行文件位于dist目录。文章详细记录了开发过程中的环境配置(包含完整依赖列表)和打包技术细节。
2025-06-26 17:43:56
454
原创 千人千面电网安全规范考核系统
本文介绍了千人千面安全规范考核系统的算法实现,该系统包含安全帽、工作服及绝缘手套佩戴检测等功能,采用YOLO系列算法结合目标检测、姿态估计等技术。系统使用Ultralytics框架进行模型训练,并转换为ONNX/TFLite格式部署。环境配置基于Python 3.10,依赖ONNX Runtime、FastAPI等工具。项目提供两种运行方式:直接执行main.py或通过FastAPI接口调用(端口16566)。该系统实现了安全装备智能检测的算法集成与部署方案。
2025-06-25 09:54:20
268
原创 YOLO算法(姿态估计+ROI区域提取+图像分类)实现头发规范判断
本文提出了一种基于姿态估计和图像分类的头发长度检测方法。首先利用姿态估计算法提取人体关键点,通过耳朵和肩膀位置确定颈部ROI区域。然后构建一个二分类数据集(合格/不合格),并使用数据增强技术扩充样本。最后训练YOLO衍生的分类模型进行判断。该方法相比传统目标检测方案,计算效率更高,且能充分利用已有姿态估计结果。实验表明,该方法在头发长度检测任务上取得了良好效果。
2025-06-17 08:46:57
835
原创 点云-标注-分类-航线规划软件
本文介绍了一款基于OpenGL+PyQt开发的点云航线规划软件,具备流式处理降低内存消耗、智能分类算法优化精度、高效渲染等功能。软件支持工程创建、点云导入与多模式渲染、台账标注、一键自动化处理(包括分类、通道分割、航线生成等)、工况分析、手动点云分类调整、航线规划与自定义模板、航线拆分以及巡检照片智能重命名等核心功能。通过可视化交互界面和自动化流程设计,显著提升了电力巡检等场景下的工作效率,支持多任务并行处理和复杂场景下的航线优化调整。软件还提供轨道安全距离预警和跨区域航线拆分等特色功能,满足专业用户的精细
2025-06-16 17:43:04
894
原创 记录从数据采集到模型部署全过程——带你快速入门算法工程师
本文介绍了基于深度学习的布控球检测系统实现方案。首先通过数据采集(57张原始图像)和标注,采用翻转、裁剪、色调调整等数据增强手段扩充至450余张训练样本。系统核心功能包括检测布控球与三脚架的摆放关系(要求放置在三角架上)、测量离地高度(>1米)以及计算布控球视角夹角(<45度)。技术实现流程涵盖数据集处理、模型训练与部署,重点展示了数据增强代码实现,包括保持长宽比的图像缩放、随机水平/垂直翻转、中心裁剪等方法,为后续目标检测模型的准确率提升奠定基础。
2025-06-16 11:27:15
1106
原创 YOLO电力物目标检测训练
摘要:本文介绍了电力物检测数据集的构建与YOLO目标检测实验过程。使用无人机采集600余张图像,包含防振锤、间隔棒和压接管三类目标。通过labelme标注工具生成JSON文件后,编写Python脚本将其转换为YOLO格式,并按8:2比例划分训练集和验证集。代码实现了矩形框坐标转换和数据集自动分割功能,为后续YOLO模型训练提供了规范化的数据准备流程。
2025-06-10 18:05:34
477
原创 安全帽目标检测
安全帽数据集处理摘要 本文介绍了如何使用HelmentDetection安全帽数据集(5000张VOC格式图像,包含head、helmet、person三类)进行YOLO格式转换。主要步骤包括: 收集VOC标注中的所有类别并创建类别映射 将VOC格式转换为YOLO格式(归一化坐标) 分割数据集为训练集(80%)、验证集(20%)和测试集(10%) 组织文件结构,创建images和labels目录并按子集分类 代码提供了完整的格式转换和数据集划分功能,实现从VOC到YOLO格式的无缝转换,为后续目标检测模型训
2025-05-30 16:35:07
687
原创 YOLO人体姿态估计Pytorch推理&&ONNX模型推理
本文介绍了基于YOLOv11n-pose模型的姿态估计方法,包含模型转换与两种推理方式。首先解析了COCO数据集的17个人体关键点(0-16序号),并说明YOLO-pose模型输出维度(1,56,8400)的含义:其中56包含4个坐标值、1个置信度及17个关键点(每个关键点含x,y坐标及可见性v值)。通过ultralytics框架可直接推理,同时演示了将pt模型转为onnx格式的方法。最后详细展示了onnx推理的后处理流程,包括坐标转换、非极大值抑制(NMS)以及关键点解析。实验结果表明,该方法能有效检测人
2025-05-28 11:27:19
775
原创 ESP8266制作遥控坦克
ESP8266 配置为服务器:ESP8266 可以配置为一个简单的 Web 服务器,监听特定端口上的传入连接。HTTP 请求处理:当手机 App 发出 HTTP 请求(如 GET 或 POST),ESP8266 接收并解析这些请求,根据请求内容执行相应的操作(比如前进、后退等)。电机控制:ESP8266 根据接收到的指令,通过 GPIO 引脚发送信号给电机驱动模块(如L298N),进而控制汽车的动作。
2025-05-20 12:33:52
679
原创 YOLO12的A2C2f模块解析
YOLOv12通过引入基于注意力机制的A2C2f模块,成功突破了传统基于卷积神经网络(CNN)的YOLO框架在速度与精度之间的权衡。A2C2f模块结合了Transformer注意力机制和多层感知机(MLP),在保持高效推理速度的同时,显著提升了目标检测性能。该模块包含卷积层(cv1和cv2)用于特征提取,以及多个ABlock,每个ABlock由注意力机制(AAttn)和MLP组成,分别用于生成查询、键、值向量和特征维度变换。YOLOv12的创新设计使其在实时性与检测精度之间实现了更好的平衡,为目标检测领域提
2025-05-17 12:06:22
4328
原创 ultralytics 中的 RT-DETR 之 模型结构解析
本文详细解析了RT-DETR-ResNet50混合检测模型在ultralytics框架中的实现。首先,文章介绍了ResNet50作为Backbone的逐层结构,包括各模块的参数、输入输出维度及其作用,重点解释了Bottleneck结构的通道扩展机制和下采样实现。随后,文章解析了Head网络的混合注意力架构,包括特征增强、多尺度特征融合、金字塔结构构建和跨层级联解码等阶段,详细说明了每个模块的功能及其对特征图的影响。整体上,该模型通过优化Bottleneck结构和特征融合策略,显著降低了计算量,同时保持了较高
2025-05-14 11:58:14
3610
原创 关于ultralytics框架计算出的结果与COCOtools结果不一致问题
博主在实验中对比了ultralytics框架和COCOtools中不同目标检测方法(如YOLO和DETR)的AP(Average Precision)计算结果,发现两者存在显著差异。在ultralytics框架中,YOLO类方法的AP值高于DETR类方法,而在COCOtools中,DETR类方法的AP值则优于YOLO类方法。博主排除了IoU阈值、面积范围和最大检测数等常见因素,认为这些差异可能与计算方式或框架实现细节有关,但具体原因尚不明确,希望与读者进一步探讨。
2025-05-13 09:38:51
455
2
原创 ultralytics框架计算大中小目标检测精度
先前在跑DETR类目标检测算法时,由于其默认使用的是COCO数据集,所以输出结果中包含不同尺度的检测精度,即大、中、小目标。而现在博主在使用时,发现其并没有这个指标效果,但在先前的实验中,博主发现DETR中计算这些指标使用的是这个工具包,那么我们就可以将检测结果和标注数据采用这个工具进行计算。话不多说,我们开整。
2025-05-12 20:59:31
600
原创 YOLO使用CableInspect-AD数据集实现输电线路缺陷检测
本文介绍了使用CableInspect-AD数据集进行输电线路缺陷检测的流程。首先,将COCO格式的数据转换为YOLO格式,通过Python脚本将json文件转换为txt格式的标签文件,并存储在labels文件夹中。接着,提取数据集中的图像文件到images文件夹,并根据标签文件进行数据集的划分。整个过程包括数据格式转换、图像提取和数据集划分,为后续的模型训练和缺陷检测提供了基础。
2025-05-09 16:06:43
397
原创 ultralytics框架进行RT-DETR目标检测训练
自DETR提出以来,其采用匈牙利匹配方式真正的实现了端到端检测效果,避免了NMS等后处理过程,同时,相较CNN的局部特征提取,其凭借着强大的全局特征提取能力,在目标检测领域可谓大杀四方,基于的目标检测方法因此层出不穷。然后,尽管DETR类目标检测方法具有较好的数据拟合能力,但本身的计算复杂度较高,这使其很难完成实时检测任务,而今天我们则要介绍的便是百度提出的实时DETR目标检测方法,这个方法我已经在先前的博客中有过介绍,当时是基于RT-DETR的源码进行介绍的,今天我们则要介绍的是中的RT-DETR模型。
2025-05-06 17:38:59
2104
7
原创 基于 PyQt 的YOLO目标检测可视化界面+ nuitka 打包
在人工智能和计算机视觉领域,是一种广泛使用的实时目标检测算法。为了直观地展示YOLO算法的检测效果,我们使用Pyqt框架进行检测结果的可视化,同时为了使其能够脱离Python环境,我们将模型文件转换为ONNX格式,并使用nuitka进行打包。
2025-05-04 20:59:10
1016
原创 YOLO旋转目标检测之ONNX模型推理
YOLO旋转检测相较于目标检测而言,其只是最后的输出层网络发生了改变,一个最明显的区别便是:目标检测的检测框是xywh,而旋转检测则为xywha,其中,这个a代表angle,即旋转角度,其余的基本相同。
2025-05-02 22:30:42
973
SSM校园服务系统.zip
2020-04-28
java电话簿管理系统.zip
2020-02-28
library.zip
2020-02-07
bookstore.zip
2020-02-07
library.zip
2020-02-07
基于SSM框架的电影院购票系统:
2025-09-15
基于SSM框架的学生档案管理系统
2025-06-23
基于SSM框架的旅游购票系统
2025-06-23
基于协同过滤算法的SSM商城系统
2025-06-03
JavaWeb学生选课系统
2021-07-26
SSM音乐视频网站.zip
2021-08-10
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅