深度知识积累AI-CSDN博客

原创双像素深度估计与去模糊：Dual Pixel 传感器 AI 实战

双像素传感器 AI 核心链路：左右子单元视差提取 → DPFeatureExtractor (Conv+Branch Split+fuse) → 任务头 (Depth/Deconv/Dehaze)。去模糊模型在合成数据上 PSNR=33.4, SSIM=0.92, 比传统盲去模糊高 5 dB。建议先用公开 DP 数据集 (?Google Dual Pixel Dataset) 预训练深度估计分支，再联合训练去模糊。双像素方案的优势在于单镜头即可实现视差，无需双目立体匹配。

2026-04-28 21:40:13 33

原创图像配准：多分辨率 ORB + RANSAC 优化

图像配准链路：输入两帧 → 高斯金字塔 (3 level) → 每层 ORB (nfeatures∝分辨率) + BF Hamming → RANSAC 单应性 → 级联变换。1920×1080 图 RMSE 从单层 7.8 px 降到多分辨率 2.8 px, 时间从 620 ms 降到 270 ms。核心贡献：粗层先算大致变换 + 高层仅估计残差, 避免高分辨率下误匹配多的问题。建议先用单层 ORB 快速验证图像间是否有足够重叠 (<50%?

2026-04-28 21:39:42 33

原创 Instruct-IPT：多任务图像恢复（去雨/去雾/去模糊）

Instruct-IPT 链路：退化图像 (雨/雾/模糊/噪) → Swin-B Patch Embed → CLIP 文本编码 → 跨模态 Cross-Attention → IPT Backbone ×12 (W₀ + ΔW, ΔW=AB, r=16) → PixelShuffle 解码 → 恢复图像。4 任务 unified PSNR=35.1, 参数量 96M (对比 4 个单任务 256M 省 62%)。核心贡献：(1) 低秩权重调制解耦共享与任务特定参数;

2026-04-28 21:38:35 35

原创 CondConv 动态卷积：多专家加权 + PyTorch 模块实现

CondConv 动态卷积链路：多专家核 (n=4, 8) + 路由网络 (GAP→FC→Softmax) → 动态加权融合 → 卷积。在 CIFAR-10 上 ResNet18 + n=4 提升 0.6% Top-1 准确率 (92.4%), 参数量仅增 0.1%, 推理速度降 < 1%。建议 n 从 4 开始调, 优先替换网络深层 (stage3/4) 的 3×3 conv, 浅层保持标准 conv 以利训练稳定性。路由网络很小 (参数量 ≈ 0.01× 总参数), 几乎无额外开销。

2026-04-28 21:37:51 27

原创 FedU-Net：联邦学习 + BraTS 多模态脑肿瘤分割

FedU-Net 联邦脑肿瘤分割链路：BraTS 2021 (4 模态, 4 类) → U-Net (5.1M) + CE+Dice 损失 → Flower 5 客户端模拟, 20 轮 FedAvg 达全局 DSC=0.828 (比单机高 7.8 个百分点)。非 IID 场景下建议增大每客户端本地 epoch 到 10 或换 FedProx 聚合器。Opacus 差隐私噪声 σ=0.01 对 DSC 影响 < 0.5%, 适合医疗合规场景。

2026-04-27 21:39:51 30

原创 3D Faster R-CNN：肺部结节检测系统完整实现

3D Faster R-CNN 用 3D ResNet 提取体数据特征、3D RPN 生成锚点框（3D 卷积分类 + 回归）、Detection Head 做精细分类与定位。MONAI 负责 NIfTI 加载与标准化，关键超参数是锚点尺寸（覆盖 2-16 体素）和 RoI Align 的采样分辨率（7×7×7）。建议先用单例验证前向是否通，再用小数据集 (50 例) 调参数，确认 mAP 能收敛后再全量训练。

2026-04-27 21:38:07 318

原创 Open3D 点云连续播放：时序可视化 + 检测框联动

Open3D 点云时序播放链路：PCD 序列 → update_geometry 原地更新点云 (points+colors) → KeyCallback 控制 (Space/箭头/+/-) → 可选 OBB 检测框同步 (clear+add) → capture_screen_image 录制 PNG → FFmpeg MP4。核心贡献：update_geometry 避免 clear+add 闪烁;30 FPS 下带框播放仍流畅。建议大点云 (>500K 点) 提前下采样到 50K, 提升播放帧率;

2026-04-27 21:36:38 29

原创 RandLA-Net + SensatUrban：户外大规模点云语义分割实战

RandLA-Net + SensatUrban 全链路：原始.ply→ 网格下采样 (0.06m) + 分块 (50m) → Random Sampling (保留 40960 点) → 4 级 LFA (LocSE + Attentive Pooling + Dilated Res Block) → 13 类 softmax。训练 200 epoch (batch=6, lr=1e-2, lr_decay=0.95/500k) 可达 mIoU ≈ 56%。

2026-04-27 21:35:10 147

原创 YOLO26 智能安防检测：从训练到实时部署完整指南

YOLO26 安防检测全链路：LabelImg 标注三类别 (person/car/anomaly) → YOLO26n 训练 100 epoch (mAP50≈0.84) → ONNX 导出 3MB → Streamlit Web 界面。先用 COCO 预训练权重在自定义数据上调优，anomaly 类数据不足时用Roboflow做增强（翻转+旋转+马赛克），或用mixup=0.2合成样本。实时推理目标帧率 ≥ 25 FPS（YOLO26n 在 RTX 3060 上可达 120 FPS）。

2026-04-27 21:33:34 25

原创 YOLO26 物体检测毕设全流程：训练 + Streamlit 部署

YOLO26n 物体检测链路：5 类 (backpack/phone/laptop/book/pen) 120 epoch 训练 (mAP50=0.78) → Streamlit Web 界面支持图片/视频/摄像头推理。小目标 (pen) 和易混淆类 (phone/book) 需单独增加训练样本。建议先用 COCO 预训练 yolo26n.pt 快速跑通 (1h)，再用 yolo26s.pt 精调提 mAP 5 个点。Streamlit 部署后可直接在浏览器中演示，适合毕设答辩现场展示。

2026-04-27 21:30:53 29

原创 YOLO26 入侵检测：自定义数据集 + Flask Web 部署全流程

监控摄像头 / 视频↓YOLO26 推理↓3 类检测├── normal_person (正常行人)├── intruder (入侵者)└── suspicious_object (可疑物)↓置信度 ≥ 0.5 + NMS↓输出: 边界框 + 类别 + 置信度↓Flask Web 界面 (上传 → 检测 → 告警)类别ID说明0正常行人, 守规矩的intruder1翻墙/闯入姿态2可疑包/工具/车辆。

2026-04-27 21:29:25 38

原创 YOLO26 厨房用品检测：模型训练 + PyQt5 实时界面

YOLO26s 厨房检测完整链路：标注 6 类 (pot/knife/cutting_board/vegetable/meat/fruit) → 80 epoch 训练 (mAP50=0.87) → PyQt5 桌面界面 (图片/摄像头/统计面板)。建议 yolo26s 在 RTX 3060 上训练约 2 小时，推理 30 FPS。弱光场景加入hsv_v=0.4和 50 张夜间样本可提升 3-5% mAP。

2026-04-27 21:28:04 126

原创 YOLO26 机器人障碍物检测：PyQt5 实时避障 + 路径规划

YOLO26s 机器人障碍物检测链路：4 类 (pedestrian/furniture/step/cable) 80 epoch 训练 (mAP50=0.86) → 实时推理 + distance_ratio 避障规则 (3 帧滑动投票) → PyQt5 界面。cable 小目标 mAP=0.74 需单独加强（copy_paste+ 特写样本），建议 Jetson Orin Nano 上 TensorRT 部署 < 30ms 推一帧。避障规则优先处理最近障碍物，行人动态场景减速等待比绕行更安全。

2026-04-27 21:26:56 264

原创 YOLO26 手势识别 + Tkinter 智能控制系统

推荐 YOLO26s (7.2M, 168 FPS) 平衡精度与速度;暗光场景需补充 100+ 低照度数据加 HSV 增强;UI 用 threading 分离推理和渲染避免界面卡顿。答辩演示时建议准备录屏视频防止现场摄像头兼容问题。

2026-04-27 21:22:16 27

原创 YOLO26 智慧农场检测：作物识别 + 病虫害诊断 + Streamlit 监测

场景挑战表现晴天基本无干扰高精度逆光亮度不均漏检增加杂草遮挡目标被遮盖召回下降多作物混种形态相似误检提升微小害虫目标 < 10px极易漏检田间摄像头/无人机↓YOLO26 推理 (conf≥0.5)↓后处理 (作物计数 + 病虫害定位)↓Streamlit 监测面板├── 实时检测画面├── 作物产量统计├── 病虫害预警└── 防治建议。

2026-04-27 21:09:05 26

原创 3D MRI 超分辨率重建：轮廓引导 GAN + MONAI 全流程

轮廓引导 GAN 做 3D MRI 超分辨率：各向异性 LR (1×1×3 mm³) → 轮廓提取 (梯度边缘) → cat 输入 ContourGuidedUNet (3.8M) + 3D PatchGAN 对抗训练 → SR (1×1×0.5 mm³, 各向同性)。PSNR=33.2 dB, SSIM=0.894, 比 Bicubic 高 4.8 dB。建议先用 2D 切片验证轮廓引导效果，再扩展 3D。轮廓提取质量直接影响重建精度，production 中用 HED 替代简单梯度。

2026-04-27 21:04:01 20

原创 SFFNet：小波变换频域分解 + 双分支遥感语义分割

SFFNet 遥感分割链路：RGB 遥感图 → Haar 小波分解 (level=1, 低频 256² + 高频 3×256²) → GlobalBranch (低频大核 7×7) + LocalBranch (高频卷积 3×3) → FusionModule (cat→128ch→上采样→seg) → mIoU=0.703 (Vaihingen, 6 类), 比 U-Net 高 6.1 个百分点。小波分解尺寸须对齐 (边长 2^level 倍数), 建议先用离线存 .npy 加速训练。

2026-04-27 21:01:40 27

原创 FedU-Net：联邦学习驱动的脑肿瘤 MRI 分割

用 Flower 框架实现 FedAvg，客户端本地上传梯度、服务器聚合后下发。差分隐私（梯度裁剪 + 高斯噪声）在隐私预算 ε<1.0 时，性能损失控制在 2-3%。建议先在单个客户端的 2D 切片上调试 U-Net，验证训练可收敛，再扩展到完整的 3D 联邦训练。BraTS 数据集的 Dice 目标：ET 0.80+、NCR 0.75+、ED 0.75+。

2026-04-27 21:00:00 23

原创 YOLOv11 训练报错全解：从 Loss 为 Nan 到精度跳水，让你一次搞定所有坑

某高校实验室因多卡训练配置错误，让 GPU 资源闲置一周。而掌握这些解决方案后，YOLOv11 训练的成功率可提升至 98%，模型精度达标率提高 40%。无论是科研论文的实验环节，还是企业项目的落地阶段，这套“排坑指南”都能让你在 YOLOv11 训练中一路绿灯。无论是科研中追求论文级精度，还是企业里赶项目工期，这套技能都能让你在 YOLOv11 训练中“兵来将挡，水来土掩”。别让报错成为你 AI 之路的绊脚石——现在就把这些方案融入你的训练流程，让每一次模型训练都能顺利收敛，每一个检测结果都能精准可靠！

2026-04-27 20:58:51 156

原创 CCFM与SENetV2双剑合璧：YOLOv11x8目标检测性能革新指南

购买即可解锁300+YOLO优化文章，并且还有海量深度学习复现项目，价格仅需两杯奶茶的钱，别人有的本专栏也有！

2026-04-27 20:58:35 110

原创 RandLA-Net + S3DIS 点云语义分割：TensorFlow 全流程

RandLA-Net + S3DIS 点云分割链路：S3DIS 室内场景分块 (10m, stride=5m) → 9 维特征 (xyz+RGB+法线) → 随机采样 (4096→2048→1024→512→256) → LFA (k=16, max+MLP) ×4 → 1×1 Conv Decoder → Softmax (13 类)。核心贡献：LFA 中的相对位置编码 + KNN max 聚合替代了密集 3D 卷积, 随机采样 O(N) 复杂度支撑百万级点云。

2026-04-27 20:58:09 20

原创 RandLA-Net 点云语义分割：S3DIS 全流程实现

RandLA-Net S3DIS 链路：S3DIS 原始点云分块 (10m, stride=5m) → 4096 点随机采样 → 6 维特征 (xyz+RGB) → LFA×4 (k=16, MLP+Max) → 随机下采样 (×4) → 1×1 Conv 解码 + Skip Connection → 13 类 Softmax。核心贡献：LFA 中相对坐标编码 + Max 池化聚合代替密集 3D 卷积, 随机采样 O(N) 支撑百万级点云。建议训练用 Area_1~5 训 Area_6 测;

2026-04-26 14:52:44 23

原创轻量 Transformer 时间序列预测：稀疏注意力 + 多步预报

轻量 Transformer 时间序列预测链路: 温度模拟数据 (seq=24, pred=12) → LightweightTransformer (d_model=16, heads=2, layers=2, window=5) → 80 epoch 达 MAPE=2.84%, 参数量仅 105K。稀疏注意力 (窗口 5) 将标准 Transformer O(L²) 降至 O(5L), 推理延迟 6ms。建议先用简单正弦波验证模型正确，再换真实工业数据 (ETT/Exchange Rate)。

2026-04-26 14:51:07 24

原创 PlainUSR：轻量实时图像超分（RepMBCConv + LIA + PlainU-Net）

PlainUSR 超分链路：Bicubic 上采样 → RepMBCConv (训练多分支/推理单分支) + LIA (通道注意力) + PlainU-Net (down→up+skip) → Tanh 输出。参数量仅 1.5M (EDSR 的 3.5%), 480p 推理 1.8ms (RTX 3060), PSNR=31.42 (Set5, ×4)。推荐轻量场景 (移动端/实时视频) 使用，若需要最高 PSNR 建议换 HAT/SwinIR。训练 100 epoch 后调用融合重参数化分支再部署。

2026-04-26 14:50:04 163

空空如也

空空如也