- 博客(1409)
- 收藏
- 关注
原创 GPT-2 文本生成:从加载到微调,完整代码实现
GPT-2 文本生成的核心 pipeline:Tokenizer 将文本编码为 token IDs → GPT-2 逐 token 预测下一个词 → 采样策略(temperature=0.7, top_k=50, top_p=0.95)控制随机性和连贯性。微调用自己领域的数据(每行一段文本)跑 3 epoch,loss 降至 2.0 以下即可。
2026-04-28 21:34:09
41
原创 Win10 RandLA-Net 点云语义分割:C++ 模块编译与 Semantic3D 训练
Win10 下 RandLA-Net 训练的核心瓶颈是 C++ 模块编译。下采样模块通常一次过,最近邻搜索模块需将knn.cppkm.cpp中的long改为long long(Win long 为 4 字节,Linux 为 8 字节)。编译成功后,Semantic3D 跑 100 epoch 约 8h (RTX 3060),mIoU 约 65%。建议先用验证编译正确性,确认 loss 下降后再调到完整配置。
2026-04-28 21:33:18
51
原创 PyTorch d 维变形场生成 + 自定义 grid_sample
输入: 源图像 (2D/3D, C×D×H×W)↓形变场 DVF (d 维位移网格)├── 正弦形变: DVF(x,y) = A·sin(2πf·x) (局部周期性)├── 多项式形变: DVF(x,y) = A·(x²+y²) (全局平滑)└── 随机 B-spline: 控制点 + 插值 → 连续场 (弹性)↓采样网格 = 原始网格 + DVF↓自定义双线性/三线性插值 (替代 grid_sample)↓输出: 变形后图像形变类型数学形式应用场景正弦。
2026-04-28 21:32:25
38
原创 OpenSlide 病理 SVS 切片处理:多层读取 + 批量裁剪全流程
OpenSlide 处理 SVS 流程:→查看层级 →获取 patch → 批量滑窗裁剪或直接 AI 模型输入。坐标始终基于 level 0 坐标系, 低层级使用换算。建议先用 ImageScope 打开切片定位 ROI, 再通过 OpenSlide 批量裁剪高倍 patch 喂给 YOLO26/UNet 等模型。
2026-04-28 21:30:58
32
原创 Lung-DETR:变形注意力 + 肺先验的稀疏肺结节检测
Lung-DETR 链路:LUNA16 CT 预处理(HU 窗位 -1000~400 + 肺分割阈值 0.25)→ ResNet50 backbone 提取 2D 切片特征 → DeformableAttention (num_points=9) 学习采样偏移捕捉不规则结节 → 100 queries + Hungarian 匹配 → mAP@0.5=0.92。
2026-04-28 21:27:40
27
原创 FedU-Net:联邦学习隐私保护脑肿瘤 MRI 分割
FedU-Net 联邦脑肿瘤分割链路:5 客户端 ×80 例 BraTS 2021 → 3D U-Net (32→1024ch) → 本地 5 epoch → FedAvg 聚合 (10 轮) → Dice=0.852 (集中式 0.881)。加 DP (σ=0.01) 后 0.838, 隐私预算 ε≈8。核心贡献:联邦学习在不共享原始 MRI 数据条件下达到接近集中式的分割精度。建议先用单机 2D U-Net 跑通数据预处理和 Dice 损失, 再切到 FL 仿真 (Flower);
2026-04-27 21:04:58
426
原创 知识图谱对话系统:Neo4j + BERT 意图识别 + Flask 全链路
知识图谱对话系统链路:Jieba + TF-IDF 意图分类 (86% 准确) → Neo4j 旅游图谱 (景点/美食/城市 三元组) → FSM 对话管理 → Flask Web 界面。book_hotel 意图需补充训练数据,推荐先用 query_scenic / query_food 两类跑通 demo。图谱查询 < 100ms, Web 端即时响应。毕设建议做 3 意图 + 100 实体图谱即可答辩演示,核心加分项是图谱推理比纯规则对话准确率高 24 个百分点。
2026-04-27 21:03:10
34
原创 酒瓶标签曲面展平 + 文字识别 (U-Net + SIFT + PaddleOCR)
酒瓶标签曲面展平+OCR 链路:原图 → 二值化+轮廓 ROI → U-Net 精确分割 → SIFT 特征点 + 凸包顶点 → 透视变换展平 (W×H) → PaddleOCR 识别。60° 曲面角度 OCR 准确率 0.74, 正面 0.92, 展平后比直接 OCR 高 43%。核心贡献:U-Net 分割使轮廓精度从 68%→85%;SIFT 顶点定位使透视变换不依赖人工点选。建议至少标注 200 张训练 U-Net;ROI 用放大;OCR 后处理用正则过滤噪音字符 (如。
2026-04-27 21:00:49
33
原创 DAF-Net:动态注意力红外-可见光图像融合
DAF-Net 红外-可见光融合链路:IR/VIS 双分支 (Conv+ResBlock → 64ch) → DynamicAttentionFusion (Cat→Sigmoid→加权) → 重建 (Conv→Sigmoid)。TNO 上 SSIM=0.782 (vs IR), 0.734 (vs VIS), 参数量仅 218K。核心贡献:轻量动态注意力门控, 无监督 SSIM+MSE 损失不需要配准 ground truth。
2026-04-27 20:54:59
267
原创 Stable Diffusion WebUI 本地部署与创作:从零到出图
本地 Stable Diffusion WebUI 部署只需 Python 3.10 + Git + 基础模型,启动后浏览器访问。核心创作流程是 prompt → 参数 → 生成,进阶靠 LoRA 调风格 + ControlNet 控结构。建议新手先调 50 张"随机种子练手感",熟练后再碰 LoRA 和 ControlNet。隐私安全和无限免费是本地部署的最大优势。
2026-04-27 20:53:04
37
原创 前列腺 MRI-病理 3D 配准:弹性形变场 + 体素重建全流程
前列腺 MRI-病理 3D 弹性配准链路:MRI T2WI (128³) + 病理切片堆叠插值 → ElasticRegistrationNet (Encoder+形变场 Decoder, 3D Conv) → NCC 损失 + 形变场平滑正则 → Dice=0.812, TRE=2.1mm。病理切片 z 向插值质量对配准影响大, 建议切片数 ≥ 20 且间距 ≤ 3mm。实际临床场景中可加前列腺分割掩码辅助 NCC 关注目标区域, 降低背景噪声干扰。
2026-04-27 20:51:02
37
原创 公园智能检测系统:YOLO26 + PyQt5 毕设实现
公园监控摄像头↓YOLO26 实时检测 (游客 / 设施 / 动物)↓PyQt5 界面显示 + 统计数据↓游客密度热力图 / 设施使用频次 / 动物出没报警公园智能检测系统用 YOLO26 识别游客、设施和动物,PyQt5 提供实时显示界面。数据集可用 COCO 做 baseline 后通过 LabelImg 标注公园专用场景做微调。建议先用 YOLO26n 验证全链路(数据 → 训练 → 导出 → 显示),确保流程无误后再升级到 YOLO26m 追求精度。
2026-04-27 20:48:41
216
原创 YOLO26 + Flask 服装识别系统:从训练到 Web 部署
购买即可解锁1000+YOLO优化文章,并且还有海量深度学习复现项目,价格仅需两杯奶茶的钱,每日更新二、环境验证:三、数据3.1 数据集数据集类别图片标注推荐用途DeepFashion213491KBBox + 关键点精细识别Fashion-MNIST1070K分类 (无 BBox)快速验证iMaterialist2281M细粒度扩展本文用 DeepFashion2 的子集,按 YOLO 格式组织:3.2 标注YOLO 格
2026-04-27 20:47:14
31
原创 夜间安全监控系统:YOLO26 + 低光增强 + 实时预警
夜间监控全链路:Zero-DCE 低光增强提亮暗区,YOLO26 检测 person/car/motorcycle/abnormal 四类目标,轨迹跟踪 + 禁区停留判断触发报警,PyQt5 展示实时画面与日志。数据增强用 Albumentations 模拟照度变化(亮度 -0.4~+0.2)是关键,Zero-DCE 预处理能将夜间检测 mAP 从 0.61 提升到 0.79。建议先验证增强+检测的延迟 ≤ 30ms,再集成报警逻辑。
2026-04-27 20:45:39
189
原创 PaddleOCR 实战:安装、配置、多语言识别与错误排查
PaddleOCR 核心链路:DB 检测 → 方向分类 → SVTR 识别。初始化时开启方向分类显著提升倒置文本的识别率。关键参数调优:检测概率阈值(低=召回高=误检多),识别 batch(大=batch 吞吐高但吃显存)。小文字场景配合 CLAHE 锐化预处理可提升字符识别率 5 个点以上。
2026-04-27 20:43:27
51
原创 像素艺术创作指南:工具 + 配色 + 动画 Aseprite 实战
像素艺术链路:16×32 画布 (小起步) → 10 色以内调色盘 → 2468 法则画形状 → Aseprite 帧动画 (4 帧, 80ms) → GIF 导出。像素核心是"以简代繁", 每格都有信息量;配色从经典游戏 (马里奥红/绿, 塞尔达金/绿) 抄起, 再调饱和度出自己的风格。动画用洋葱皮工具逐帧对齐, 循环帧首尾相接。
2026-04-27 20:41:30
27
原创 知识图谱旅游对话系统:KG + BERT + Neo4j
知识图谱旅游对话系统链路:用户文本 → jieba+spacy 分词NER → TF-IDF+LR/BERT 意图分类 (4 类) → 规则槽位填充 → Neo4j 知识图谱 (50 节点, 关系: 位于/推荐) → 状态机 (welcome→ask→suggest→book→end) → mt5 生成或模板响应 → Flask API。意图准确率 0.85, 比规则基线高 23%;多跳推理路径可追溯到 3 跳。建议每个意图训练样本至少 500 条;Neo4j 建索引加速;
2026-04-27 20:37:34
29
原创 Raw 图像超分辨率:双分支 CNN 实现细节与色彩协同增强
Raw 图像超分用 Raw 细节分支超分单通道亮度数据、色彩校正分支在每个空间位置学习 3×3 色彩变换矩阵实现像素级自适应校色。数据生成通过模糊+下采样+噪声模拟真实相机退化。建议先在小分辨率 (64×64 → 256×256) 上验证训练是否收敛,再用 MIT-Adobe 5K 或自己的 Raw 数据集做完整训练。色彩矩阵在每个像素位置独立预测是核心——允许模型校正局部色彩偏移。
2026-04-26 14:17:04
34
原创 V-Mamba:2D 选择性扫描状态空间模型图像分类
V-Mamba CIFAR-10 分类链路:32² RGB → Stem Conv (3→64ch, stride2→16²) → VMambaBlock ×4 (SS2D 四方向 → Mamba S6 扫描 → MLP) → GAP → Linear → 10 类。核心贡献:SS2D 四方向扫描将 2D 空间建模转为 4 个 1D 序列, 计算复杂度从 O(N²) 降至 O(N)。建议先从 CIFAR-10 dim=64 depth=4 验证 SSM 收敛性;
2026-04-26 14:15:26
40
原创 注意力机制与经典 CV 网络:PyTorch 实现与实战
注意力机制(SE/空间/CBAM/Non-Local)通过权重重标定让模型聚焦关键特征,经典 CNN(ResNet/DenseNet/FPN)提供了深层网络、特征复用和多尺度融合的基础骨架。建议先在 ResNet 上插入 SE 模块(通道注意力)做基线实验,再根据任务类型引入空间注意力(分割任务)或非局部注意力(视频任务)。CIFAR-10 数据集适合快速验证注意力模块的有效性,迁移到更大数据集时保持相同的结构设计思路即可。
2026-04-26 14:13:18
30
原创 Open3D 点云播放:连续帧可视化完整实现
Open3D 点云播放核心是。建议用复用点云对象减少闪烁,帧数多时用延迟加载避免 OOM,用绑定空格/R/±键实现播放控制。单帧帧率目标 ≥ 15 FPS 才感觉流畅。
2026-04-26 14:11:38
25
原创 TransformerUNet 医学图像分割:牙齿 X 光 + PyTorch 全链路
TransformerUNet 医学分割链路:牙齿 X 光二分类 → DoubleConv 局部特征 + TransformerEncoderBlock (heads=8) 全局注意力 → Encoder-Decoder 带 skip。80 epoch 达 mIoU=0.912 (U-Net 的 104%), 参数量 6.8M (比 U-Net 少 13%)。建议二分类跑通后再扩展多类 (pulp/dentin/enamel), 扩展时对每个类别单独算权重避免长尾类被忽略。
2026-04-26 14:09:52
17
原创 SCTRANet:空间-通道交叉 Transformer 红外小目标检测
SCTRANet 红外小目标检测链路:IR 灰度 (256²) → 浅层 Conv (64ch) → 下采样到 16² → SCTBlock ×3 (空间←→通道双向交叉注意力) → ASPP 多尺度 → 上采样 → Sigmoid 热图。SIRST 上 IoU=0.748, F1=0.823, 参数量 2.1M。核心贡献:双向交叉注意力, 空间序列 (定位) 与通道向量 (筛选) 互相引导。建议先用 U-Net 跑通基线验证数据/热图质量, 再加 SCTBlock;
2026-04-26 14:07:58
20
原创 OpenSlide 病理 SVS 切片处理:多层读取 + 批量裁剪全流程
OpenSlide 处理 SVS 流程:→查看层级 →获取 patch → 批量滑窗裁剪或直接 AI 模型输入。坐标始终基于 level 0 坐标系, 低层级使用换算。建议先用 ImageScope 打开切片定位 ROI, 再通过 OpenSlide 批量裁剪高倍 patch 喂给 YOLO26/UNet 等模型。
2026-04-26 14:06:12
19
原创 Lung-DETR:变形注意力 + 肺先验的稀疏肺结节检测
Lung-DETR 链路:LUNA16 CT 预处理(HU 窗位 -1000~400 + 肺分割阈值 0.25)→ ResNet50 backbone 提取 2D 切片特征 → DeformableAttention (num_points=9) 学习采样偏移捕捉不规则结节 → 100 queries + Hungarian 匹配 → mAP@0.5=0.92。
2026-04-26 14:04:16
21
原创 GaussianBev + REVFormer:3D 高斯表示 + 可逆 Transformer BEV 分割
购买即可解锁1000+YOLO优化文章,并且还有海量深度学习复现项目,价格仅需两杯奶茶的钱,每日更新模块传统方法GaussianBev + REVFormer提升3D 表示体素/伪点云/注意力 query各向异性高斯云精度+形状表达不确定性建模粗糙概率图协方差隐式编码远距+遮挡鲁棒Transformer 显存O(L·d²) 随层数线性增长O(d²) 恒定可堆 48+ 层推理速度12 FPS (BEVFormer)15 FPS (ours)+
2026-04-26 14:02:27
24
原创 3D 多类别 Tversky Loss:原理 + PyTorch 实现 + 超参数调优
Tversky Loss = TP / (TP + α·FP + β·FN),通过 α 和 β 独立控制误检和漏检的惩罚力度。PyTorch 实现只需要注意维度顺序:logits (N, C, D, H, W) → softmax → 去掉背景 (可选) → one-hot 标签 (N, C, D, H, W) → 在 D×H×W 上求和 TP/FP/FN。肿瘤分割等漏检严重的场景推荐 α=0.3, β=0.7, include_background=False;过分割场景推荐 α=0.7, β=0.3。
2026-04-26 14:01:03
18
原创 指纹细节点提取与修复:Matlab 实现
指纹细节点提取的核心是 Gabor 增强 + Crossing Number 检测。Gabor 参数中 lambda(脊线间距)设为 5-7 像素,sigma(高斯包络宽度)设为 4-6,大部分场景通用。修复小范围缺失可以用方向插值,大范围缺失需要深度学习模型。建议先用标准数据集(如 FVC 2002/2004)测试提取准确率,确保端点和分叉点的检测正确率在 85% 以上,再切换到目标场景的指纹。
2026-04-26 13:59:37
15
原创 图像超分辨率:Sub-Pixel 卷积原理与 PyTorch 实现
"""Sub-Pixel 卷积超分网络,4 倍上采样"""# 输出通道数 = in_channels × scale²return x# 测试前向。
2026-04-26 13:58:01
18
原创 树莓派 5 + YOLO26 实时口罩识别系统
YOLO26n 在树莓派 5 上 320×320 输入可达 10 FPS,结合 GPIO 控制继电器就能实现口罩门禁。关键点是使用口罩专用数据集微调模型(COCO 预训练权重不包含口罩类),否则只能用 person 检测 + 推理区域裁剪的间接方案。建议先用 PC 微调好模型,再部署到树莓派,树莓派端只需运行推理和 GPIO 控制。
2026-04-26 13:56:28
21
原创 DeOldify 老照片上色:模型选择、参数调优与批量修复
DeOldify 上色的关键参数是artistic(模型选择)和(渲染倍数)。人像场景用稳定模型()加,风景/历史照片用艺术模型()加。批量处理时建议先单张测试确定最优参数,再对整个目录应用。遇到 OOM 优先降低 render_factor 而不是换 CPU——CPU 模式速度会降低 10 倍以上。
2026-04-26 13:54:44
21
原创 用 Ultralytics YOLO26 + PyQt5 打造工业缺陷检测 GUI 应用
训练阶段 部署阶段Ultralytics YOLO26 (PyTorch) PyQt5 GUI 桌面应用YOLO26.onnx ──────────────→ onnxruntime 加载├── 图片检测├── 摄像头实时检测└── 视频文件检测用 Ultralytics 训练 YOLO26 模型,导出 ONNX 格式,在 PyQt5 界面中通过 onnxruntime 加载并推理。用户不需要安装 PyTorch,也不需要写命令行,打开 GUI 选图/开摄像头即可看到检测结果。
2026-04-26 13:52:48
19
原创 GAN 图像上色 + 动作迁移:从黑白照片到动态视频
DeOldify 上色 + FOMM 动作迁移的组合可以让一张黑白老照片变成彩色动态短视频。DeOldify 的关键参数是 render_factor(30 左右),FOMM 的关键是驱动视频的动作幅度不宜过大。串联时先用 DeOldify 上色并保存,再以彩色图为 source 输入 FOMM。建议先用一张高质量正面照测试整个 pipeline 跑通,再批量处理更多老照片。
2026-04-26 13:50:42
27
原创 老照片上色 + 人物动态化:GAN 与动作迁移实战
DeOldify 上色 + FOMM 动作迁移的组合,可以让一张黑白老照片变成彩色动态视频。单张上色的关键参数是 render_factor(30 左右),动态化的关键是驱动视频的动作幅度不宜过大。先用上色结果替换 FOMM 的 source 输入即可串联两个模型。建议在制作演示视频时输出纯脚本文本版本,再通过剪辑加入转场和背景音乐来提升展示效果。
2026-04-26 13:48:48
19
原创 Jetson Nano + YOLO26 + TensorRT:边缘 AI 实时目标检测
Jetson 端直接用加载。Jetson Nano 上跑 YOLO26 需要 TensorRT 加速才能达到实时。推荐输入 320×320 + FP16 精度,延迟约 30ms,可覆盖大部分实时检测场景。部署流程是 PC 端训练 →→ scp 到 Jetson → TensorRT Python/C++ 推理。先在 PC 上用trtexec验证 engine 可正常推理后,再部署到 Nano,可以省去 Jetson 上编译 engine 的时间。
2026-04-26 13:47:21
26
原创 基于MobileNetV4与YOLOv8的高效模型设计与优化:移动端实时目标检测部署全流程解析
MobileNetV4融合YOLOv8为移动端目标检测提供了一个优秀的解决方案。通过Universal Inverted Bottleneck和Mobile MQA注意力机制的创新,该方案在保持检测精度的同时显著降低了计算复杂度。高效的架构设计:UIB统一了不同瓶颈块设计,Mobile MQA实现了39%的加速移动端友好:专为EdgeTPU和移动GPU优化灵活的模型选择:提供从Small到Hybrid-Large的多种配置完整的工具链:支持训练、优化、量化和多格式导出。
2026-04-26 13:45:26
143
原创 YOLOv8性能提升方案:CoordAtt注意力机制集成与优化全流程教程
注意力机制在计算机视觉领域扮演着越来越重要的角色,特别是在目标检测任务中。YOLO系列作为实时目标检测的代表性算法,其性能优化一直是研究热点。本文将详细介绍如何在YOLOv8中集成CoordAtt(Coordinate Attention)注意力机制,这是一种专为移动端网络设计的高效注意力机制。CoordAtt注意力机制不同于传统的通道注意力机制,它巧妙地将位置信息融入到通道注意力中,能够在保持计算效率的同时显著提升模型的特征表达能力。
2026-04-26 13:44:46
435
原创 MicroPython + ESP32 接入百度 AI 大模型:智能物联网助手
ESP32 是一颗集成 WiFi + BLE 的微控制器,价格约 10 元。它的算力显然跑不动大模型,但可以作为网络终端——ESP32 采集传感器数据或接收用户输入,通过 HTTP 请求调用百度千帆平台的 ERNIE Bot API,拿到回答后执行相应动作或回显。↓│├── HTTP POST → 百度千帆 API│ ├── Access Token 鉴权│└── 输出决策(LED / 继电器 / OLED 屏幕 / 语音播报)
2026-04-25 09:53:30
53
原创 智能车牌识别系统:YOLO 检测 + OCR 识别的全流程方案
YOLO 检测车牌 + OCR 识别字符的技术链路是目前车牌识别系统最主流的实现方式。YOLOv5 负责定位(单类别检测,mAP 可达 0.98),EasyOCR 负责识别(中英文车牌字符精度 ≥ 0.95),两段流水线组合即可形成一个可用的车牌识别系统。建议先把两段链路分别验证通过——先用一张包含完整车牌的图像测试 OCR 识别是否正确,再验证 YOLO 能否从完整画面中正确裁剪出车牌区域——然后才做端到端联调。
2026-04-25 09:52:15
69
原创 野生动物入侵智能检测:基于 YOLO 的生态安全监测系统
从数据集构建到模型训练,从摄像头实时推理到桌面预警界面,本文覆盖了一套野生动物入侵检测系统的完整路线。这个场景有个区别于前面几篇的显著特点:数据采集难度高——目标动物不会配合拍摄,标注图像主要依赖红外触发相机的随机捕捉。建议在项目初期就部署相机到目标区域收集 2-4 周的数据,同时用网络图片和动物园图片做补充。
2026-04-25 09:51:11
31
融合经典与深度学习方法的科研全路径:从ARIMA、LSTM到Transformer的模型对比与创新应用设计
2026-01-05
【计算机视觉】YOLOv8损失函数解析:基于DFL与交叉熵的边界框与分类损失协同优化设计
2026-01-05
YOLOv8分类与边界框损失优化:目标检测精度提升的科研方法与创新实践
2026-01-05
【计算机视觉】YOLOv8目标检测损失函数解析:分类与定位联合优化模型设计
2026-01-05
YOLOv8检测头与损失函数解析:多尺度预测及DFL边界框回归在目标检测中的应用研究
2026-01-05
基于YOLOv8的检测头与损失函数深度解析:目标检测模型核心组件设计及实战优化
2026-01-05
YOLOv8检测头与损失函数协同优化:面向多尺度目标检测的科研创新方法研究
2026-01-05
基于DynamicConv3的YOLOv5轻量化改进:低FLOPs高精度模型设计与工业落地应用
2026-01-05
基于DynamicConv3的YOLOv5轻量化优化:低FLOPs下高精度目标检测模型设计与实现
2026-01-05
基于DynamicConv的YOLOv5改进模型:低FLOPs下高精度目标检测方法研究
2026-01-05
传统与深度学习方法综述:ARIMA、Prophet、LSTM、Transformer模型在多场景下的应用与优化策略
2026-01-05
传统模型与深度学习融合:基于ARIMA-LSTM的多变量时序预测系统设计与工业级部署
2026-01-05
基于SimAM与NAM的轻量注意力机制:YOLOv8目标检测性能优化方法研究
2026-01-05
YOLOv8融合SimAM与NAM注意力机制:轻量无参与标准化设计在目标检测中的精度与速度优化方案
2026-01-05
基于SimAM与NAM的轻量注意力机制:YOLOv8目标检测模型优化与科研实验设计
2026-01-05
【计算机视觉】基于可变形注意力的YOLOv8改进:复杂场景下小目标与遮挡目标精准检测方法研究
2026-01-05
YOLOv8融合可变形注意力(DAT)的目标检测优化:复杂场景下不规则目标精准识别技术实现
2026-01-05
基于可变形注意力的YOLOv8改进:不规则目标检测模型设计与科研实验方法
2026-01-05
YOLOv8融合多维协作注意力MCA:面向复杂场景目标检测的高精度特征增强方法设计
2026-01-05
基于MCA多维协作注意力的YOLOv8改进:目标检测中通道-空间-尺度特征融合方法研究
2026-01-05
融合Dual与HetConv的CSPHet轻量架构:YOLOv8模型参数降低70%的科研优化方案
2026-01-05
基于Dual与HetConv的CSPHet轻量架构:YOLOv8参数压缩70%精度提升实战设计
2026-01-05
【计算机视觉】基于CSPHet与YOLOv8的轻量级目标检测模型设计:异构卷积与Dual思想融合的科研实践方案
2026-01-05
基于AIF注意力机制的目标检测模型优化:YOLOv8与RT-DETR融合的复杂场景检测方法研究
2026-01-05
基于AIF模块的YOLOv8改进:融合注意力与特征交互的实时目标检测优化方案
2026-01-05
基于AIF模块的YOLOv8改进:复杂场景下长距离依赖与小目标检测精度提升方法
2026-01-05
基于SPD-Conv的YOLOv8小目标检测优化:空间深度转换卷积在多尺度特征提取中的应用研究
2026-01-05
基于SPD-Conv与YOLOv8融合的小目标检测模型优化:低分辨率场景下的特征增强方法研究
2026-01-05
基于SPD-Conv的空间深度转换卷积优化:YOLOv8小目标检测精度提升方法与工业应用
2026-01-05
基于DynamicConv的YOLOv8改进:低FLOPs场景下目标检测精度提升方法研究
2026-01-05
基于DynamicConv2的YOLOv8轻量化改进:低FLOPs场景下目标检测精度提升方法
2026-01-05
基于DynamicConv2的YOLOv8改进:低FLOPs下高精度目标检测的原理与实战
2026-01-05
基于AKConv的YOLOv8轻量级改进:任意形状采样卷积助力多尺度目标检测精度提升
2026-01-05
基于AKConv的轻量级卷积优化:YOLOv8多尺度目标检测高效特征提取方法研究
2026-01-05
基于AKConv的动态卷积优化:YOLOv8轻量级模型在多尺度不规则目标检测中的高效特征提取方法研究
2026-01-05
基于DCNv4可变形卷积的YOLOv8改进:不规则目标检测精度提升方法研究
2026-01-05
基于DCNv4的YOLOv8目标检测优化:可变形卷积在复杂场景下的高效自适应特征提取方法
2026-01-05
【计算机视觉】基于YOLOv8的模块化目标检测架构设计:科研与工程协同的模型开发框架解析
2026-01-05
基于YOLOv8的目标检测架构解析:从目录结构到核心模块的功能拆解与工程实践应用
2026-01-05
基于YOLOv8的模型架构解析与科研创新路径:从目录结构到轻量化、多模态及自监督检测方法设计
2026-01-05
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅