- 博客(107)
- 资源 (12)
- 收藏
- 关注
原创 SiamFC 算法详解
SiamFC作为孪生网络跟踪器的开创性工作,通过简洁高效的设计实现了实时目标跟踪,为后续研究提供了重要基础。虽然存在一些局限性,但其核心思想仍被广泛应用,不断推动着视觉目标跟踪领域的发展。
2025-04-25 12:01:43
98
原创 SiamFC算法深度解析
SiamFC(Siamese Fully-Convolutional Networks)是一种基于孪生网络(Siamese Network)的视觉目标跟踪算法,由Bertinetto等人在2016年提出。适用于需要实时跟踪的场景,如无人机追踪、视频监控、自动驾驶等,尤其在对速度要求较高的场景中表现突出。,将响应图上的每个位置视为二分类样本(正样本为真实目标中心,负样本为背景区域)。:后续帧中可能包含目标的更大区域(通常为255×255像素)。输出为响应图(17×17),最大值对应目标在搜索区域中的位置。
2025-04-24 22:21:31
173
原创 CamShift目标追踪算法
CamShift(Continuously Adaptive Mean Shift)算法是Mean Shift算法的改进版本,主要用于视频序列中的目标跟踪。它通过动态调整搜索窗口的大小和方向,适应目标在运动过程中的尺度变化和旋转,广泛应用于计算机视觉领域,如人脸跟踪、物体追踪等。从上一帧的目标位置开始,在反向投影图上运行Mean Shift算法,寻找密度最大的区域(即新目标位置)。对后续每一帧,计算每个像素属于目标颜色分布的概率,生成反向投影图(概率密度图)。依赖颜色分布,若背景与目标颜色相似易失效。
2025-04-24 11:52:40
90
原创 Mean-Shift目标跟踪算法详解
其改进版(如CAMShift)可解决尺度问题,但复杂场景需结合其他特征或深度学习模型。结合卡尔曼滤波(Kalman Filter)预测目标位置,提升快速移动时的鲁棒性。对直方图进行归一化,得到概率分布 ququ(uu为直方图的bin索引)。通过Mean-Shift迭代,找到相似度最高的区域(密度峰值)。联合颜色、纹理(LBP)、或深度特征(如HOG)增强判别能力。统计目标区域内颜色的概率分布(即“目标模型”)。将目标的颜色分布(如HSV空间的H通道)表示为。:手势跟踪(如基于肤色的手部追踪)。
2025-04-23 16:55:44
63
原创 KCF目标追踪算法 (Kernelized Correlation Filters) 详解
该算法基于相关滤波(Correlation Filter)理论,结合核技巧(Kernel Trick)和循环矩阵(Circulant Matrix)性质,在计算效率与跟踪精度之间取得了良好的平衡。KCF算法因其高速度(可达数百FPS)和较高的鲁棒性,成为目标跟踪领域的重要基准方法之一。KCF算法的核心思想是通过训练一个滤波器,使其在目标位置处产生最强的响应,从而在后续帧中快速定位目标。:传统的相关滤波器是线性的,KCF通过核方法(如高斯核、多项式核)将其扩展到非线性情况,提高分类能力。
2025-04-23 14:15:21
294
原创 在 Windows 下安装 Dify 教程
确保 Docker Desktop 正在运行并有足够资源(至少 4GB 内存分配给 Docker)现在您已经在 Windows 上成功安装并运行了 Dify,可以开始构建您的 AI 应用了!:所有数据会自动保存在 Docker 卷中,即使容器停止也不会丢失。下载并安装 Docker Desktop for Windows。安装完成后启动 Docker Desktop。确保在设置中启用 WSL 2 后端(推荐):如果 80 端口被占用,可以在。PostgreSQL 数据库。推荐配置至少 8GB 内存。
2025-04-22 11:23:11
1177
原创 Mask R-CNN
不仅能够完成目标检测(检测物体并给出边界框),还能为每个检测到的物体生成精确的像素级分割掩码(Mask)。:二值交叉熵(Binary Cross-Entropy),计算每个像素的预测掩码与真实掩码的误差。的掩码(K 是类别数,m 是掩码分辨率,通常 14×14 或 28×28)。Mask 分支仅预测当前类别对应的掩码,避免不同类别竞争,提升分割质量。:预测每个 RoI 的分割掩码(Mask),采用 FCN 结构。在原有的分类(Class)和回归(Box)分支基础上,新增一个。
2025-04-22 09:37:24
819
原创 图像分割的发展历程
如Non-local Networks(2018)、CBAM(2018),增强重要区域权重。扩展Faster R-CNN,增加分割分支,实现检测与分割一体化(实例分割)。:结合编码器-解码器和空洞空间金字塔池化(ASPP),提升多尺度分割能力。:扩展至点云(如PointNet++)和时序数据(如MaskTrack)。:如SAM(Meta),通过提示(prompt)实现零样本分割。(2001):将分割转化为能量最小化问题,结合颜色和边界信息。:使用SIFT、HOG等特征结合分类器(如SVM)进行分割。
2025-04-22 09:04:46
416
原创 ByteTrack自定义数据集训练指南
使用NVIDIA Jetson部署,启用--fp16和--trt以下是使用ByteTrack 通过保留低置信度检测框(传统方法会过滤掉),利用运动关联(IoU匹配)和外观特征(可选)实现高精度多目标跟踪,尤其适合遮挡和拥挤场景。
2025-04-21 13:51:08
609
原创 unet训练自己的数据集
通过以上步骤,即可完成UNet在自定义数据集上的训练和部署。图像和标签:图像(如.jpg.png)和对应的分割掩膜(mask,需与图像同名且尺寸相同)。目录结构dataset/train/images/ # 训练图像masks/ # 对应的标签val/images/ # 验证图像masks/ # 对应的标签。
2025-04-21 11:03:22
896
原创 DeepLabv3+训练自己的数据集指南
希望这个指南能帮助你成功训练自己的DeepLabv3+模型!使用不同的backbone(如Xception)提高精度。对应的标注图像(PNG格式,每个像素值代表类别ID)类别ID应从0开始连续编号(0,1,2,...)标注图像应为单通道,像素值0通常表示背景。添加数据增强(随机缩放、旋转、颜色变换):减小batch_size或图像尺寸。输入图像(如JPG/PNG格式):尝试降低学习率或使用学习率调度。:增加数据增强或使用正则化技术。使用混合精度训练加速训练过程。:在损失函数中使用类别权重。
2025-04-21 10:38:27
663
原创 FairMOT与MCFairMOT算法对比
扩展 FairMOT 的单类别检测头,支持同时预测不同类别的中心点和边界框。可选方案:为不同类别设计独立的Re-ID子网络,减少跨类别特征混淆。需同时跟踪多类别目标(如交通监控中的车、人、非机动车)。有足够算力支持多类别计算(如服务器或高性能GPU)。:减少无关类别的干扰(如车辆轨迹不会匹配到行人)。:需平衡不同类别的样本分布(避免类别不平衡)。,可进一步优化多类别场景下的抗遮挡能力。,并调整损失函数(如类别加权交叉熵)。仅需跟踪单类别目标(如行人或车辆)。可接受稍低的帧率以换取多类别支持。
2025-04-18 16:42:32
805
原创 CenterTrack
的多目标跟踪(MOT)算法,由 Xingyi Zhou 等人提出(ECCV 2020)。显式学习目标的运动模式(而非依赖 Kalman 滤波),更适合非线性运动(如行人突然转向)。,从而实现高效的单阶段(One-Stage)跟踪,适用于实时应用(如自动驾驶、视频监控)。否则初始化为新目标。对短暂丢失的目标(如遮挡),保留历史轨迹一段时间(类似 SORT 的机制)。:预测目标从 t−1t−1 帧到 tt 帧的位移(Δx,ΔyΔx,Δy)。上一帧的检测热图 Ht−1Ht−1(可选,用于增强时序信息)
2025-04-18 16:39:30
952
原创 BoT-SORT算法
显著提升了复杂场景下的跟踪稳定性,是 SORT 系列算法的先进版本。:传统 Kalman 滤波假设目标运动是线性的,但在实际场景中,相机可能移动(如车载摄像头、无人机拍摄),导致目标运动非线性。:DeepSORT 使用外观特征(Re-ID)辅助匹配,但在遮挡或低分辨率情况下可能失效。,在SORT、DeepSORT和OC-SORT的基础上进一步提升了跟踪鲁棒性,尤其是在。:传统 SORT 使用固定的过程噪声和观测噪声,无法适应不同运动速度的目标。:对未匹配的检测和轨迹,使用 Re-ID 特征计算相似度。
2025-04-18 16:37:18
777
原创 OC-SORT算法
OC-SORT(Observation-Centric SORT)是一种基于观测中心的多目标跟踪(MOT, Multi-Object Tracking)算法,是对经典SORT(Simple Online and Realtime Tracking)算法的改进。传统SORT以预测为中心(如Kalman滤波的预测优先),而OC-SORT更注重当前帧的观测结果,减少对不可靠预测的依赖。在数据关联时,不仅考虑位置和IOU(交并比),还加入运动方向的一致性判断(如速度向量夹角),减少相似外观目标的误匹配。
2025-04-18 16:19:50
540
原创 FairMOT算法详解
同时完成目标检测和重识别(Re-ID)特征提取,解决了传统两阶段方法(如DeepSORT)中检测与Re-ID任务的不公平性问题,显著提升了跟踪的准确性和效率。,即让检测(Detection)和重识别(Re-ID)两个任务在同一个网络架构中。检测器和Re-ID模型分开训练,检测框的质量直接影响Re-ID特征提取。检测误差会传递到Re-ID阶段,导致ID切换(ID Switch)增加。输出热图(Heatmap),预测目标中心点(类似CenterNet)。:引入全局Re-ID检索(如BoT-SORT)。
2025-04-18 16:14:27
1582
原创 图像篡改检测算法
然而,面对不断演进的篡改手段和生成技术(如AIGC),算法需持续进化以平衡准确性、效率和泛化能力。:端到端学习篡改特征(如MesoNet、ManTra-Net)。:识别GAN生成图像的频域伪影(如FakeCatcher)。:适应新型篡改技术(如Diffusion模型生成内容)。:篡改区域边缘可能不自然(如模糊、锐化过度)。:突出可疑区域(如EXIF信息引导的检测)。:依赖预嵌入信息(如数字水印、数字签名)。:结合噪声、纹理、光照等特征提升鲁棒性。:IoU(交并比)、篡改定位准确率。
2025-04-18 16:01:30
559
原创 AI中台系统设计方案探讨
集成JupyterLab、低代码建模工具(如H2O.ai)、预训练模型库(Hugging Face、PaddleHub)。:通过REST/gRPC接口封装AI能力(如OCR、语音识别),支持流量控制与鉴权(如Kong、Apigee)。:服务注册发现(Consul)、熔断降级(Hystrix)、监控告警(Prometheus+Grafana)。:分布式存储(如HDFS、Ceph)与对象存储(如S3、OSS),支持海量数据高速读写。加密传输(TLS)、动态脱敏(如数据掩码)、访问控制(RBAC)。
2025-04-18 15:58:34
720
原创 yolo系列发展
后续版本在保持速度的同时,通过结构创新(如FPN、RepVGG)和训练技巧(如动态标签分配)持续提升精度。:由Alexey Bochkovskiy团队提出(非官方版本,但被广泛认可)。:从两阶段(Faster R-CNN)到单阶段(YOLO),再到轻量化设计。:输入图像尺寸动态调整(320×320到608×608),增强鲁棒性。:通过3种不同尺度的特征图(FPN结构)检测不同大小目标。:引入先验框(Anchor),提高边界框预测的多样性。:引入残差结构(ResNet),提升特征提取能力。
2025-04-18 14:52:11
587
原创 目标检测综述
通过滑动窗口遍历图像,结合手工设计的特征(如HOG、SIFT、Haar)和分类器(如SVM、Adaboost)进行检测。(You Only Look Once):YOLOv1(2016)到YOLOv9(2024),兼顾速度与精度。(2020):首次将Transformer引入目标检测,端到端训练,无需手工设计组件(如NMS)。:用边界框(Bounding Box)标出物体的位置,通常用坐标(x, y, w, h)表示。:结合文本(如CLIP)、点云(LiDAR)等信息。
2025-04-18 14:43:14
78
原创 unet算法发展历程简介
UNet是一种基于深度学习的图像分割架构,自2015年提出以来经历了多次改进和扩展,逐渐成为医学图像分割和其他精细分割任务的标杆。:对称的U形网络,左侧(编码器)通过下采样提取特征,右侧(解码器)通过上采样恢复空间分辨率。UNet的成功得益于其简洁性、灵活性和可扩展性,未来仍将是图像分割领域的重要基线模型。:空间/通道注意力(如SE模块)、自注意力(Non-local模块)。:将编码器的高分辨率特征与解码器的上采样特征拼接,保留局部细节。处理3D医学图像(如CT、MRI),在解码器中使用3D反卷积。
2025-04-18 14:34:40
960
原创 DeepLab 算法发展历程
DeepLab 系列至今仍是语义分割领域的基石,后续许多工作(如 OCRNet、Mask2Former)均受其启发。:多尺度特征融合显著提升分割精度(PASCAL VOC 2012: 79.7% mIOU)。:DeepLabv3 输出分辨率低(通常为输入尺寸的 1/8),边界模糊。:成为语义分割的标杆模型,支持轻量化(MobileNetV2)和实时应用。:传统 CNN 通过池化(Pooling)降低分辨率,导致空间信息丢失。:自动搜索更优的 DeepLab 结构(如 Auto-DeepLab)。
2025-04-18 09:11:13
602
原创 DeepLabv3+ 简介
的架构,在语义分割任务中实现了高精度和鲁棒性,至今仍是工业界和学术界的常用模型。:并行使用不同膨胀率(dilation rate)的卷积,识别不同大小的物体。编码器输出(经过 ASPP)先进行 4 倍上采样,再与主干网络的低层特征融合。模块,显著提升了物体边界的分割精度,同时保持了多尺度上下文信息提取的能力。:支持高性能(ResNet)和轻量化(MobileNet)主干网络。在不降低特征图分辨率的情况下,扩大感受野,捕捉多尺度信息。和高层语义信息,优化分割结果的细节,特别是物体边缘。
2025-04-18 09:02:35
1170
原创 DeepSORT 目标追踪算法详解
DeepSORT 凭借其高效的实时性和稳定的追踪效果,已成为多目标追踪领域的基准算法。通过合理选择检测器、优化Re-ID模型及调整参数,可显著提升其在复杂场景下的性能。领域的经典算法,通过结合目标检测、运动预测和外观特征匹配,实现了高效、稳定的实时追踪。MOTA=1−漏检数+误检数+ID切换数总目标数MOTA=1−总目标数漏检数+误检数+ID切换数。:将大模型(如ResNet50)蒸馏至轻量模型(如MobileNetV2)。:提取目标的深度特征(128维或256维向量),用于区分不同目标。
2025-03-19 14:48:01
1391
原创 基于深度学习的目标追踪技术全解析
模拟遮挡训练鲁棒表示(Occlusion-Aware R-CNN)。:引入区域建议网络(RPN),联合分类与回归提升定位精度。:FP16/INT8量化与层融合(NVIDIA GPU)。:逐帧检测目标,通过数据关联(匈牙利算法)跨帧链接轨迹。:融合YOLO检测与Re-ID特征,卡尔曼滤波预测轨迹。:卷积与Transformer结合,平衡局部与全局信息。:FAIR的检测与追踪平台(集成Mask R-CNN)。:CLIP模型实现未知类别追踪(如OVTrack)。:联合训练检测与Re-ID,解决特征不一致问题。
2025-03-19 14:31:40
994
原创 目标追踪综述
目标追踪的核心任务可定义为:给定视频序列初始帧中目标的标注信息(通常为边界框或掩码),在后续每一帧中预测目标的时空状态(位置、尺度、运动轨迹等)。其核心挑战在于如何建模目标的外观与运动特征,并应对复杂环境干扰(如遮挡、光照变化、背景杂波等)。
2025-03-06 16:15:52
730
原创 android实现串口接入
准备一个兼容Android的USB-to-Serial转换器。这些设备带有相应的驱动程序,确保它们与安卓系统的兼容性。在应用首次运行时,系统会根据连接的硬件设备自动触发intent。:确保你的安卓设备支持USB On-The-Go(OTG)。大多数现代手机都支持这一功能,但为了保险起见,可以在购买前确认或通过测试应用检测。请将 YOUR_VID 和 YOUR_PID 替换为你的串口设备的实际VID和PID。启动Android Studio,创建一个新的Android项目。通过添加以下依赖项到你的。
2025-03-03 16:34:54
1072
原创 Faster R-CNN 算法详解
深度特征网络(Backbone Network):用于提取图像的高层次特征,比如 VGG 或 ResNet。区域建议网络(RPN,Region Proposal Network):用于生成候选区域(RoIs)。Fast R-CNN 检测器:对每个 RoI 进行类别分类和边界盒回归。特征提取区域建议生成分类和回归Faster R-CNN作为一代经典的目标检测框架,其核心创新在于将区域建议生成与深度特征网络紧密融合,加快训练速度并显著降低计算复杂度。
2025-03-03 08:38:09
557
原创 SSD目标检测
上述代码示例中使用PyTorch框架,易于理解和验证,实验结果可以在公开数据集上进行评估,如PASCAL VOC或COCO数据集,以检验模型性能。定义数据集加载器,实现数据增强策略,如随机裁剪、翻转等。实现非极大值抑制,定义评估指标如mAP,并提供测试代码。配置数据加载器,定义优化器和损失函数,并实现训练循环。定义SSD模型的结构,包括特征提取网络和预测器。c) 数据加载与训练循环。a) 数据加载与预处理。
2025-03-02 09:35:47
52
原创 基于机器学习的图像分类综述
基于深度学习的图像分类技术在过去几年取得了长足进步,并在多个领域(如计算机视觉、医学影像分析等)得到了广泛应用。然而,随着应用场景的复杂化,如何进一步提升模型性能、降低计算成本并增强泛化能力仍需更多的研究与创新。
2025-03-02 09:24:45
239
原创 python接入串口数据
时可能会出现异常,例如设备脱离或参数配置错误。确保用 try-except块来捕获这些异常。: 使用适当的缓冲区或超时机制,以确保不会有太多数据积累而被忽略。方法会阻塞直到有数据可用。: Default 情况下,
2025-02-26 14:55:58
655
原创 232、485、422串口的对比
此外,当为新系统选择接口时,考虑现有的硬件库(如USB转RS-485适配器)和相关设备的兼容性也至关重要。适用于需要多个设备协同工作的情况,如建筑物Automation、交通系统(如红绿灯控制)、工业过程监控和自动化生产线。常见于数据终端设备、测量仪器、工业控制系统等领域,例如远程监控站点与中心控制室的数据连接,或是高速和精密度要求较高的自动化环境中。:常见于台式电脑、打印机等设备的连接,尤其在短距离通信中广泛使用,如仪器控制和工业自动化中的简单设备接口。
2025-02-26 11:05:54
928
原创 物联网串口综述
串口(Serial Port)是一种用于设备之间传输数据的接口,其特点是以一条信号线依次传输数据位,因此它是一种“serial”通信方式。
2025-02-26 11:00:37
892
原创 聚类分析介绍
算法数据分布簇数明确性噪声处理计算效率K均值圆形、密度较高需要指定不适合高效层次聚类层次结构或簇数未知可选中等较低DBSCAN任意形状,具有密度差异未指定适合一般通过对各类聚类方法的比较与实际应用案例,当项目面临不同类型的数据挑战时,可以选择合适的算法并优化其性能。
2025-02-25 11:50:42
44
原创 车牌检测识别流程
车牌识别系统通过摄像头拍摄车辆图像,然后利用图像处理和机器学习技术来自动识别车牌号码。这一系统在停车场管理、交通监控、电子收费等领域有广泛的应用。
2025-02-25 11:46:38
419
原创 车牌检测与识别技术综述
随着智能交通系统的快速发展,车牌检测与识别技术在交通管理、电子收费、停车管理等领域发挥了重要作用。近年来,基于深度学习和计算机视觉的技术不断进步,使得车牌检测与识别的准确率和鲁棒性显著提升。本文从基础理论、关键技术、应用场景到未来挑战进行全面综述,并分析了当前研究热点与发展趋势。
2025-02-25 11:35:16
271
原创 Siamese网络
Siamese算法,通常也称为“孪生网络”(Siamese Network),是一种在计算机视觉和深度学习领域中广泛应用的算法。它主要用于处理需要比较两组输入数据相似性或差异性的任务,如人脸验证、图像匹配、文本相似度评估等。
2025-02-25 11:01:18
1030
原创 基于Siamese网络的人脸识别
通过建立基于Siamese网络的人脸识别模型,可以有效改善传统分类模型在小样本情况下的表现,提供更具区分力的特征表示。然而,在实际应用中还需考虑数据配对的合理性、网络结构的选择等多个因素,确保模型能够适应不同场景的需求。此外,Siamese网络与其他深度学习技术(如GANs、Triple Loss等)结合使用,可以进一步提升人脸识别的准确性和稳定性,为未来的相关研究和发展提供了广阔的可能性。
2025-02-25 09:29:46
313
口罩数据集(mask,nomask),VOC格式,可用于目标检测
2022-07-12
目标检测数据集扩充程序
2023-12-04
基于深度学习的摔倒检测
2023-03-06
基于yolov5的猪体(pig)识别
2023-03-04
牛(cow)目标检测数据集
2023-03-04
牛(cow)数据集,VOC格式
2023-03-04
基于深度学习的钢筋端面识别
2023-03-04
yolov5牛体检测识别
2023-02-28
tkinter实现图像与视频中的人员统计
2023-02-27
前后端实现口罩检测与人脸识别
2023-02-19
python-flask-vue实现前后端人体与车辆属性检测
2023-02-18
基于yolov6的安全帽检测
2022-10-18
基于yolov5的安全帽检测
2022-10-18
PaddleOCR+HTML 图像OCR识别系统介绍
2025-04-20
视频人体属性检测演示系统
2025-04-18
html实现的经典贪吃蛇游戏
2025-04-09
Flask + YOLO + HTML 实现前后端图像/视频目标检测:零基础实战教程
2025-04-07
【Flask+paddle深度学习】高精度音频识别系统(附完整源码、模型&详细部署教程)
2025-04-07
VisionTransformer图像分类
2024-05-08
VGGNet图像分类算法
2024-05-08
GoogleNet图像分类算法
2024-05-08
pyqt+yolo+lprnet车牌检测识别系统
2024-05-06
ResNet图像分类算法
2024-05-06
DenseNet图像分类
2024-05-05
AlexNet图像分类
2024-05-04
图像视频的车牌检测系统
2024-04-26
目标检测数据集的扩充升级版
2024-04-11
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人