自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

小小老大MUTA的博客

多模态大模型,计算机视觉

  • 博客(280)
  • 收藏
  • 关注

原创 RL--RLHF--PPO--GRPO--DPO速通

RL--RLHF--PPO--GRPO--DPO速通(概念详解,算法优化更新过程)

2025-09-11 16:26:36 1558

原创 Transformer内容详解(通透版)

Transformer内容详解,非常非常详细的内容解析

2025-08-20 22:57:22 1583

原创 模型冻结Model Freezing

模型冻结Model Freezing 核心知识点

2026-01-21 09:21:52 345

原创 上采样方式——SubPixelConv 亚像素卷积

亚像素卷积(上采样)

2026-01-20 15:56:14 906

原创 BCEWithLogitsLoss

BCEWithLogitsLoss 相较于BCELoss的优势(数值稳定性)

2026-01-20 13:53:40 298

原创 实验分析——融合特征图可视化(附代码)

多模态图像融合,通过特征图可视化模块融合效果

2026-01-09 11:44:57 1097

原创 x86 架构下运行 ARM-ROS2 Docker 镜像操作指南

Docker在ubuntu上的安装以及x86 架构下运行 ARM-ROS2 Docker 镜像操作指南

2026-01-09 11:44:01 352

原创 论文速览:《Spatial–Frequency Domain Transformation for Infrared Small Target Detection》

提出了一种名为SFDTNet的网络,该网络将频域注意力和U型结构结合用于红外小目标检测。

2026-01-03 16:06:35 592

原创 运动跟踪算法中的卡尔曼滤波器

卡尔曼滤波

2025-12-22 15:03:29 628

原创 论文速览:《AMDANet: Attention-Driven Multi-Perspective Discrepancy Alignment for RGB-Infrared Image Fusi》

注意力驱动的多模态差异对齐网络(AMDANet)(语义一致性推理 + 特征差异对齐 + 相互特征掩码学习)

2025-12-16 16:58:59 1053

原创 Deepsort详解(论文翻译+解读)

精读deepsort论文,并解析其完整流程

2025-12-16 14:06:14 1403

原创 边缘计算资源分配和任务调度优化

边缘计算资源分配和任务调度优化

2025-12-15 16:55:21 870

原创 BOXMOT 多种跟踪方案复现

ByteTrack, OC-SORT, StrongSORT (Lite), BotSORT (Lite) DeepOC-SORT, StrongSORT, BoTSORT, HybridSORT, BoostTrack + OSNet, CLIP-ReID 多种多目标跟踪方法,可插拔直接对接目标检测模型

2025-12-15 16:53:21 1216

原创 使用ImageZMQ将本地摄像头画面传输到服务器

使用ImageZMQ将本地摄像头画面传输到服务器,并通过flask将服务器端接收到的画面通过网页在本地查看

2025-12-11 14:13:07 387

原创 使用flask将服务器端的视频通过网页在本地查看

使用flask将服务器端的视频通过网页在本地查看

2025-12-11 11:32:00 381

原创 指定人员的长时间跟随方案探讨

指定人员的长时间跟随方案探讨 单目标跟踪 vs 多目标跟踪

2025-12-10 15:56:08 741

原创 论文速览:《HaarFuse: A dual-branch infrared and visible light image fusion network based on Haar wavelet》

基于 Haar 小波变换的端到端图像融合框架,主要RGBT融合中全局上下文信息丢失、高频细节(纹理)模糊以及噪声的问题

2025-12-02 16:16:01 824

原创 git常用操作

git常用操作

2025-12-02 14:30:19 580

原创 ROS2 功能包的创建(C++ 和 Python版)

ROS2 功能包的创建(C++ 和 Python版)

2025-12-01 10:36:16 557

原创 git传输超过100MB的文件

git 使用LFS传输超过100MB的文件

2025-11-27 15:28:46 716

原创 Git的使用(程序猿必会)

git的简单使用

2025-11-27 09:50:31 1056

原创 论文精读:《A review of recent techniques for person re-identification》

行人重识别综述

2025-11-26 14:44:37 1066

原创 论文精读:《RGBT Tracking via All-layer Multimodal Interactions with Progressive Fusion Mamba》

通过具有渐进融合Mamba的全层多模态交互实现RGBT跟踪

2025-11-24 12:45:00 321

原创 跟踪的评价指标

跟踪常见评价指标

2025-11-24 08:30:00 85

原创 论文精读:《Observation-Centric SORT:Rethinking SORT for Robust Multi-Object Tracking》

出了基于观测的SORT,在保持简单、在线和实时的同时,对遮挡和非线性目标运动表现出更强的鲁棒性

2025-11-14 16:44:41 1005

原创 语义分割中上采样Up-sampling的原理

面试八股

2025-11-14 11:43:19 962

原创 什么是RKNN?

RKNN 以及 .rknn文件

2025-11-11 15:58:20 641 1

原创 话题 Topic | 服务 Service | 动作 Action

话题 Topic | 服务 Service | 动作 Action

2025-11-10 14:34:17 944

原创 论文速览:《Complementary Advantages: Exploiting Cross-Field Frequency Correlation for NIR-Assisted Image》

基于跨域频率相关性的近红外辅助RGB图像去噪

2025-11-05 20:54:06 1113

原创 Sigmoid vs Softmax

Sigmoid vs Softmax 在分类问题上的适用

2025-11-03 20:42:21 507

原创 VOT跟踪竞赛历届方法概述

VOT跟踪竞赛历届冠军经验分享

2025-11-03 15:51:21 884

原创 MixFormerV2 复现全流程

MixFormer v2 单目标跟踪算法复现全流程

2025-11-01 15:45:48 1317

原创 主流语义分割解码器详解(MLP | DeepLab v3 | UperNet)

主流语义分割解码器详解(MLP | DeepLab v3 | UperNet)

2025-10-29 17:13:52 1025

原创 论文速览:《A weight-sharing based RGB-T image semantic segmentation network with hierarchical feature en》

基于权重共享的RGB-T图像语义分割新网络

2025-10-29 15:20:37 696

原创 论文精读:《TPT-Bench: A Large-Scale, Long-Term and Robot-Egocentric Dataset for Benchmarking Target Pers》

新的大规模目标人物跟踪数据集,并对现有的最先进TPT方法进行实验比较

2025-10-28 19:22:47 682

原创 论文精读:《A Deep Dive into Generic Object Tracking: A Survey》

通用目标跟踪包括基于孪生网络的跟踪器、判别式跟踪器、Transformer三种主流方法的综述

2025-10-28 11:01:23 1462

原创 小波变换详解

小波变换详解 小波变换和傅里叶变换的区别 Haar小波变换过程

2025-10-25 12:36:34 1244

原创 论文速览:《DECS-Net:A dual encoder crack segmentation network with Haar wavelet-basedhigh–low frequency 》

裂缝检测任务:基于CNN 和 Transformer的双编码器 , 采用小波分解高低频信息分别进行注意力计算

2025-10-25 11:15:33 1093

原创 论文速览:《Exploring Fourier Prior and Event Collaboration for Low-Light Image Enhancement》

基于幅度-相位纠缠与对齐的时间相机和RGB的能见度恢复网络

2025-10-19 23:00:16 1080

原创 论文精读:《Robot Person Following in Uniform Crowd Environment》

基于RGBD的在统一着装人群中的目标任务跟踪算法

2025-10-17 15:38:18 703

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除