计算机视觉研究院-CSDN博客

原创干货 | 利用手持摄像机图像通过卷积神经网络实时进行水稻检测

点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID｜计算机视觉研究院学习群｜扫码在主页获取加入方式获取论文：关注并回复“水稻”计算机视觉研究院专栏Column of Computer Vision Institute小农户在全球粮食供应中发挥着重要作用。随着智能手机越来越普及，它们使小农能够以非常低的低成本收集图像。PART/1摘要在本研究中，研究者提出了一种有效的深度卷积神经...

2024-01-07 10:30:55 1190

原创 YoloV8与ChatGPT互通，这功能是真的强大！

点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID｜计算机视觉研究院学习群｜扫码在主页获取加入方式参考地址：https://github.com/ultralytics/ultralytics计算机视觉研究院专栏Column of Computer Vision Institute现在的ChatGPT都是输入文字、图片或者语音，那如果将检测网络或者更上层一点的东西，把视觉与ChatG...

2023-07-12 08:26:47 580

原创突破小缺陷检测瓶颈！PVT+YOLOv12 多尺度检测模型，筑牢建筑安全防线

为核心，解决了混凝土缺陷检测中小目标难识别、样本不平衡、算力要求高的三大痛点，不仅适用于建筑结构检测，还可拓展至制造、医疗等高精度小目标检测场景，为工业视觉智能化升级提供高效、可靠的技术方案。混凝土裂缝、剥落、泛碱、露筋等缺陷，会直接削弱结构稳定性，是建筑坍塌、地陷的核心诱因，早期精准检测是安全防控关键。微小缺陷与混凝土背景纹理高度混淆，传统 CNN 感受野有限，难以捕捉长距离特征依赖，小缺陷漏检、误检率高。效果：整体 mAP 提升 4%，稀有缺陷 mAP 提升 9%，大幅降低小缺陷漏检率。

2026-05-28 17:30:00 246

原创复杂场景多目标跟踪新突破！RGTrack 算法：精度、速度、轻量化三管齐下

计算机视觉研究院主要涉及深度学习领域，主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院主要着重”技术研究“和“实践落地”。模型，用重参数化卷积 + 全局注意力 + 多级关联策略，实现跟踪精度、推理速度、模型轻量化全面提升，特别适合嵌入式与资源受限设备。SSMA-YOLO：一种轻量级的 YOLO 模型，具备增强的特征提取与融合能力，适用于无人机航拍的船舶图像检测。，兼顾 Non-local 的全局建模能力与 SE 的高效计算，让网络自动忽略冗余信息，聚焦目标主体。

2026-05-28 17:30:00 335

原创长时遮挡不再慌！UMOT：多目标跟踪长短时关联统一框架

计算机视觉研究院主要涉及深度学习领域，主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。，从根本上解决复杂遮挡、外观相似场景的跟踪失效问题，在 DanceTrack、MOT17 上实现全面领先，为安防、自动驾驶、行为分析等场景提供更鲁棒的多目标跟踪方案。SSMA-YOLO：一种轻量级的 YOLO 模型，具备增强的特征提取与融合能力，适用于无人机航拍的船舶图像检测。双模块，端到端联合优化，兼顾邻帧精准匹配与跨帧轨迹找回。YOLO-S：小目标检测的轻量级、精确的类YOLO网络。

2026-05-27 12:00:00 611

原创 PCPE-YOLO：轻量化小目标检测新突破，精准又高效！

计算机视觉研究院主要涉及深度学习领域，主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。小目标仅占图像极小区域，特征信息匮乏、背景干扰强，传统 YOLO 系列模型在极端小目标检测上存在漏检、定位不准问题；对比 YOLOv8m，PCPE-YOLO 能精准识别密集遮挡场景中的极端小目标，注意力热图更聚焦小目标区域，抗干扰能力大幅提升。SSMA-YOLO：一种轻量级的 YOLO 模型，具备增强的特征提取与融合能力，适用于无人机航拍的船舶图像检测。PCPE-YOLO 新增。

2026-05-27 12:00:00 574

转载今年做YOLO的人注意啦！YOLO27或许...

正规机构保障：背靠研途考研，深耕教育十余年，重交付、重口碑是我们一贯的理念，大公司将为你的科研之路和自身权益全程保驾护航！这是一支实力强大的高学历导师团队，在计算机科学、机器学习、深度学习等领域，积累了丰富的科研经历，研究成果也发表在国际各大顶级会议和期刊上，在指导学员的过程中，当然，除了 YOLO 26，应该有很多同学还在坚持用 v8、v10。的同学，想要从选题、创新点设计，到实验设计与验证、到论文逻辑，公式图表绘图都有一个。YOLO 26：更快、更准、更轻，是覆盖全场景、全任务的边缘视觉解决方案。

2026-05-26 12:00:00 74

转载太原科技大学李岩团队NTE期刊一种ELTDF-Net焊接缺陷检测模型

模型，就是为工业超声相控阵焊接缺陷检测量身定制的“智能检测专家”，既解决了人工判断误检率高、传统模型能力不足的老问题，又实现了检测精度、效率和工程实用性的三重提升，为工业无损检测的高精度需求提供了全新的解决方案，让焊接缺陷再也逃不过“智能法眼”！更贴心的是，团队还把模型核心算法封装成了相控阵焊接缺陷智能分类系统，有友好的交互界面，能实时预测、可视化结果，直接落地工业现场，从理论创新变成了能实际用的生产力工具！“生命线”，一个未熔合、裂纹的微小缺陷，就可能引发介质泄漏、管体爆裂的大事故！

2026-05-25 09:28:56 26

原创聚焦亚洲视觉前沿 | CVIPPR 2026 上海交大启幕，三大技术突破重塑计算机视觉未来

在上海交大闵行校区盛大召开。作为亚洲视觉领域年度学术盛会，本次会议汇聚了全球 300 + 顶尖专家学者，以「视觉智能赋能未来：从理论创新到产业落地」为主题，全方位展示了计算机视觉、图像处理与模式识别领域的最新突破与应用成果。作为亚洲地区视觉领域重要会议，CVIPPR 2026 特别设置「亚洲视觉技术应用专场」，聚焦亚洲国家在智慧城市、智能制造、医疗健康等领域的特色应用，同时邀请欧美顶尖学者分享国际前沿成果，促进东西方学术思想碰撞。，在移动端实现实时目标检测与跟踪，功耗降低 60%，为智能驾驶提供新方案。

2026-05-25 09:28:56 639

原创 YOLOE-26：实时开放词汇实例分割新标杆，YOLOv26 与 YOLOE 强强联合

成为部署优先的巅峰之作：原生端到端预测、移除 DFL 损失、搭载 MuSGD 优化器，在低功耗 CPU 与边缘设备上实现超低延迟，覆盖检测、分割、姿态估计等多任务。YOLOE-26 以 YOLOv26 为基础骨架，保留无 NMS 端到端优势，同时重构分类头，加入三大关键模块，构建统一语义嵌入空间。：大模型精度登顶，小模型极致轻量化，n/s 版本可部署低功耗设备，l 版本适配边缘 GPU，兼顾长尾类别分割。回归头预测框坐标，分割头输出掩码原型与系数，全程无 NMS，单前向传播出结果，确定性拉满。

2026-05-23 17:30:00 599

原创突破遥感小目标检测瓶颈！空间 - 通道协同注意力多尺度检测网络重磅发布

计算机视觉研究院主要涉及深度学习领域，主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院主要着重”技术研究“和“实践落地”。，有效解决遥感图像多尺度目标检测难题，在复杂背景、小目标、密集场景下表现优异，同时实现轻量化设计，具备极强的工程落地价值。的多尺度目标检测网络，在三大公开遥感数据集上实现检测精度与计算效率双突破，为复杂场景遥感目标检测提供轻量化实用方案。SSMA-YOLO：一种轻量级的 YOLO 模型，具备增强的特征提取与融合能力，适用于无人机航拍的船舶图像检测。

2026-05-23 17:30:00 545

原创面向边缘部署：基于YOLOv11-SEFA的文物展馆可解释轻量级跌倒检测

计算机视觉研究院主要涉及深度学习领域，主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。，为文物展馆、博物馆等公共文化空间提供了可落地的老人跌倒监测方案。可解释轻量化跌倒检测系统，在悉尼 Rochfort 文物展馆完成实地落地，实现低延迟、低功耗、高精准的跌倒预警，完美适配文物建筑的监测需求。SSMA-YOLO：一种轻量级的 YOLO 模型，具备增强的特征提取与融合能力，适用于无人机航拍的船舶图像检测。模型决策核心为倾斜角、姿态比，完全符合人体跌倒的安全逻辑，无伪相关干扰。

2026-05-23 17:30:00 548

原创一口气读懂：YOLO 在遥感影像里到底有多强？（从 v1 到 v12 全梳理）

计算机视觉研究院主要涉及深度学习领域，主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。SSMA-YOLO：一种轻量级的 YOLO 模型，具备增强的特征提取与融合能力，适用于无人机航拍的船舶图像检测。无人机入侵检测、车辆 / 军事目标识别、红外弱目标检测全天候、远距离、高精度监控。自动识别：建筑、道路、车辆、排水口、电线杆高精度制图，支撑城市规划、违建巡查。YOLOv8：解耦头 + 无锚框，极简又能打，成为遥感标配。越新的 YOLO，越擅长遥感里的小目标、密集目标、旋转目标。

2026-05-22 10:30:00 586

原创突破小目标与低对比度瓶颈：Merge-YOLO 图书包装缺陷精准检测

计算机视觉研究院主要涉及深度学习领域，主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院会针对不同领域分享实践过程，让大家真正体会摆脱理论的真实场景，培养爱动手编程爱动脑思考的习惯！SSMA-YOLO：一种轻量级的 YOLO 模型，具备增强的特征提取与融合能力，适用于无人机航拍的船舶图像检测。，推动 Merge‑YOLO 更快落地图书供应链质检，为智能物流提供更可靠的视觉检测方案。YOLO-S：小目标检测的轻量级、精确的类YOLO网络。

2026-05-22 10:30:00 556

原创无人机航拍小目标车辆检测太难？LMAD‑YOLO 一招搞定精度与速度！

计算机视觉研究院主要涉及深度学习领域，主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院主要着重”技术研究“和“实践落地”。SSMA-YOLO：一种轻量级的 YOLO 模型，具备增强的特征提取与融合能力，适用于无人机航拍的船舶图像检测。LMAD-YOLO 是目前无人机航拍车辆小目标检测的优质方案，精度高、重量轻、泛化强，工程落地价值拉满！ViT-YOLO：基于Transformer的用于目标检测的YOLO算法。YOLO-S：小目标检测的轻量级、精确的类YOLO网络。

2026-05-21 10:30:00 618

原创毫米级精准不复杂！YOLO26 姿态模型在前臂解剖点检测的对比研究

计算机视觉研究院主要涉及深度学习领域，主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院主要着重”技术研究“和“实践落地”。SSMA-YOLO：一种轻量级的 YOLO 模型，具备增强的特征提取与融合能力，适用于无人机航拍的船舶图像检测。（固定拍摄角度、有限姿态变化、小样本标注）场景下，这种 scaling 优势是否成立，始终没有明确答案。标注点：5 个解剖标志点（LI11、LI10、TE5、LI4、TE3）测试模型：YOLO26-N/S/M/L/X 5 种变体，算力跨度。

2026-05-21 10:30:00 585

原创蓝莓智慧灌溉新突破！轻量化 YOLO 模型实现生长阶段实时精准检测

计算机视觉研究院主要涉及深度学习领域，主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。，完美平衡检测精度、速度与轻量化，解决蓝莓田间生长阶段检测难题，为智慧灌溉、产量预估提供核心技术，助力高价值果蔬标准化种植。SSMA-YOLO：一种轻量级的 YOLO 模型，具备增强的特征提取与融合能力，适用于无人机航拍的船舶图像检测。遮挡、弱光、阴雨环境下检测稳定性远超 Faster R-CNN、SSD、YOLOv5/v8/v12 等模型。复杂场景下各模型检测效果对比（本文模型全目标检出）

2026-05-20 10:30:00 422

转载 2026年238个好发CCF-A的强化学习idea全面汇总！

该研究的核心思路是将测试用例生成建模为一个多智能体强化学习（MARL）问题，通过让多个 LLM 智能体协同工作，共同探索出能够最大化代码覆盖率的测试路径。作者通过一项大规模的实证研究，分析了 LLMs 在代码生成、缺陷检测和修复等关键 SE 任务中的表现，旨在揭示其在实际开发场景中的优势与局限性。该研究的核心思路是将测试用例生成建模为一个多智能体强化学习（MARL）问题，通过让多个 LLM 智能体协同工作，共同探索出能够最大化代码覆盖率的测试路径。为方便大家研究的顺利进行，早点发出自己的顶会，我给大家对。

2026-05-20 10:30:00 34

原创精准识别胡椒成熟度！YOLO-AVCA-CBAMNet 让智慧农业更高效

计算机视觉研究院主要涉及深度学习领域，主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。这套方案不仅为胡椒产业提供了高效精准的智能检测工具，也为苹果、芒果、辣椒等各类果蔬的智慧化分级、自动化采收提供了可复制的技术思路。一体化深度学习框架，在自然田间环境下实现胡椒果成熟度的精准检测与分类，为精准农业提供高效、可落地的智能解决方案。SSMA-YOLO：一种轻量级的 YOLO 模型，具备增强的特征提取与融合能力，适用于无人机航拍的船舶图像检测。

2026-05-19 10:31:00 530

原创前沿：小目标检测，YOLOv11n 再进化！

计算机视觉研究院主要涉及深度学习领域，主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。实现 34FPS 实时推理，完美适配无人机、智能监控、嵌入式边缘设备，为无人机巡检、交通感知、安防监控提供高精度、高效率的小目标检测方案。SSMA-YOLO：一种轻量级的 YOLO 模型，具备增强的特征提取与融合能力，适用于无人机航拍的船舶图像检测。ViT-YOLO：基于Transformer的用于目标检测的YOLO算法。YOLO-S：小目标检测的轻量级、精确的类YOLO网络。

2026-05-18 18:01:53 484

原创农业深度视觉：探究 YOLO 算法在植物叶片病害分类中的应用效能

计算机视觉研究院主要涉及深度学习领域，主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。结语：YOLO 驱动的农业视觉检测，正从实验室走向田间地头，用 AI 守护粮食安全。随着技术持续迭代，轻量、精准、易用的病害检测方案，将成为智慧农业的标配！SSMA-YOLO：一种轻量级的 YOLO 模型，具备增强的特征提取与融合能力，适用于无人机航拍的船舶图像检测。凭借 “速度 + 精度” 双优表现，成为农业病害智能检测的首选方案，为精准农业筑牢防线。

2026-05-18 18:01:53 538

原创基于小波变换与渐进式特征金字塔网络的高效目标检测方法 —— 以电网巡检为例

计算机视觉研究院主要涉及深度学习领域，主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院主要着重”技术研究“和“实践落地”。未来，团队将进一步优化轻量化主干网络、融合光谱 - 空间注意力，打造更低时延、更高精度的电网巡检专用检测器，为电力基础设施安全保驾护航！模型可精准识别复杂背景下的风筝、气球、鸟巢、垃圾等异物，即便异物与导线重叠、对比度极低，也能精准框定，无漏检、误检。天空、草地等低频背景，与电线、铁塔、细长异物等高频结构共存，普通卷积无法兼顾，易模糊小目标；

2026-05-17 12:02:30 493

原创监控场景垃圾检测新突破！EcoDetect-YOLOv2 轻量高效，精准识别多尺度垃圾

模型，基于 YOLOv8s 深度优化，专为复杂监控环境的多尺度垃圾检测而生，兼顾轻量部署与精准检测，破解城市垃圾智能监控核心难题。新增 160×160 的 P2 检测头，保留细粒度特征与位置信息，专门捕捉 8×8 像素以下的微小垃圾，从根源解决小目标漏检问题。的监控场景垃圾检测，可直接接入城市监控系统，大幅降低人工巡检成本，助力自动化垃圾管理、数字城市与智慧环卫建设。SSMA-YOLO：一种轻量级的 YOLO 模型，具备增强的特征提取与融合能力，适用于无人机航拍的船舶图像检测。

2026-05-17 12:02:30 449

原创基于YOLO的施工现场隐患智能识别系统

计算机视觉研究院主要涉及深度学习领域，主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。未规范佩戴安全帽、违规吸烟、脚手架变形、安全网破损、线缆损坏等隐蔽隐患，依靠人工巡检难以实时发现，成为施工安全的重大隐患。在无人机视角、高分辨率、遮挡作业等复杂场景下，改进模型的漏检率、误检率远低于原始 YOLOv5n，小目标与密集目标检测稳定性大幅提升。模型，在参数量、算力消耗、检测精度上实现最优平衡，对比 YOLOv8n、YOLOv12n 等同量级模型，更适配工地边缘部署。

2026-05-16 12:30:17 543

原创面向数字孪生智能工厂的三维物体重建与生成流水线高效合成缺陷研究

计算机视觉研究院主要涉及深度学习领域，主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。为解决这一问题，研究团队构建「3D 物体重建 + 合成缺陷生成 + YOLO 检测验证」全流程框架，无需 CAD 模型，仅用手机拍摄视频即可生成高质量 3D 模型，再批量合成缺陷数据，最终用 YOLO 模型验证效果。本文基于 NeRF 3D 重建、NVIDIA Omniverse 合成数据生成与 YOLO 目标检测，提出一体化解决方案，有效填补仿真与现实的差距，大幅提升缺陷检测模型泛化能力。

2026-05-16 12:30:17 610

原创 Nature 子刊重磅！砂型铸造图像分割开源数据集，破解工业 4.0 自动化难题

这份专用工业数据集，填补了砂型铸造图像分割的数据空白，为工业 4.0 背景下的小批量制造自动化提供了关键支撑。从数据到模型，再到现场落地，智能制造的最后一公里，终于有了可落地的解题思路。，融合真实拍摄、3D 合成、数据增强三类图像，已开源至 Kaggle，直接为工业图像分割模型训练提供 “现成弹药”。SSMA-YOLO：一种轻量级的 YOLO 模型，具备增强的特征提取与融合能力，适用于无人机航拍的船舶图像检测。工业场景缺乏专用的砂铸分割标注数据集，AI 模型无高质量数据支撑，分割精度始终上不去。

2026-05-15 09:31:12 490

原创基于 YOLO 的城市河流漂浮垃圾实时计数：为防洪与水资源管理装上 “AI 慧眼”

计算机视觉研究院主要涉及深度学习领域，主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。数据集，覆盖 13 类垃圾：瓶子、树枝、易拉罐、杯子、泡沫、塑料袋、成堆垃圾、塑料盒、纸板、遮阳棚、桌子、椅子、大伞，精准匹配城市河道真实场景。整套监测单元包含：AI 云台相机、NVIDIA Jetson 边缘计算设备、雷达水位计、气象站，支持昼夜全天候作业，数据不上云也能实时推理。AI 让河道 “看得见、数得清、能预警”，为城市防洪与水资源管理提供低成本、可复制的智能方案！

2026-05-15 09:31:12 561

原创仅 4 秒！离线边缘 AI 相机，精准识别美洲狮，野外无人值守也能用

计算机视觉研究院主要涉及深度学习领域，主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架，提供论文一键下载，并分享实战项目。SSMA-YOLO：一种轻量级的 YOLO 模型，具备增强的特征提取与融合能力，适用于无人机航拍的船舶图像检测。的两阶段 AI 解决方案，在野外实现秒级野生动物事件分类，误报极低、适配夜间红外，还能快速迁移到其他物种。，用 “宽检测 + 精分类” 的两阶段 pipeline，在树莓派 5 上就能跑，全程不用网。

2026-05-15 09:31:12 563

原创精准识别遮挡杂草！SSS-YOLO 刷新田间杂草检测新高度

用大核卷积捕捉长距离特征关联，绕过被作物遮挡的杂草区域，联动无遮挡区域增强有效特征，通过通道注意力过滤噪声，让模型 “看穿” 遮挡。将多尺度池化与边缘感知结合，大感受野获取遮挡目标周边背景信息，精准推断被遮挡杂草特征，强化叶片边缘细节，清晰区分杂草与作物边界。算法，专为复杂田间环境的遮挡 / 重叠杂草检测设计，轻量化同时实现精度大幅跃升，为智能除草、农田精细化管理提供硬核技术支撑！未来研究团队将持续扩充数据集，提升模型对更多杂草种类的适配能力，让 AI 技术扎根田间，让智慧农业更智能、更高效！

2026-05-14 09:36:23 488

原创铁路接触网异物检测迎技术突破！专用数据集 + 智能网络，筑牢高铁安全防线

计算机视觉研究院主要涉及深度学习领域，主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院主要着重”技术研究“和“实践落地”。未来，团队将聚焦模型轻量化、多传感器融合，让这项技术更快落地应用，守护每一趟高铁的平安出行！，有效解决小目标、细长形异物检测难题，为电气化铁路智能巡检、安全运维提供了全新技术方案。复杂场景适配：遮挡、雨天、强光 / 弱光、噪声环境下，无漏检、误检，检测稳定性拉满。覆盖全场景：包含雾天、光照变化、遮挡、雨雪等复杂环境，还原真实铁路运营工况；

2026-05-14 09:36:23 674

转载时过境迁，有效的多模态创新还是得从这些论文里找

论文提出的 DCER 框架通过双阶段压缩与能量重建，有效解决了多模态融合中输入噪声、模态缺失两大核心难题，同时实现了内在不确定性量化，在多模态情感分析数据集上达到 SOTA，大幅提升了真实场景下多模态模型的鲁棒性与可靠性，为实用化多模态系统提供了可落地的新思路。论文面向多模态情感计算，提出循环自适应校正流 CaReFlow，依托校正流实现多模态间一对多分布映射，搭配自适应松弛对齐解决一对多映射方向模糊问题，并通过循环校正流保留模态特有信息，以此缩小模态差异、提升多模态融合效果。看了最近的顶会，感觉。

2026-05-14 09:36:23 25

转载 2026年，那些靠YOLO发顶会的人都在走什么捷径？

除了个人科研成绩突出，更有丰富的论文辅导经验，不仅自己能写出顶会一作，更指导出多名发独立一作论文的学生，满足各个方向的辅导需求。不止是交付论文初稿就结束服务，针对指定服务方案的学员，哪怕遇到拒稿、退稿情况，也会提供免费修改优化的维护服务，1v1量身制作您的科研课程，不同的分区价格不同，课程顾问会根据你的情况给你做详细的介绍，以及后期的学习规划。篇幅有限，仅展示部分课题，名额有限，先到先得，趁着开学发paper，惊艳众人！选题、调研、idea验证、代码、实验、润色、投稿、直至中稿的一站式科研服务。

2026-05-13 09:30:55 40

原创井下防护装备佩戴检测新突破！CGALS‑YOLO 让煤矿安全监控更智能

计算机视觉研究院主要涉及深度学习领域，主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。现有 YOLO 系列模型虽轻量化、速度快，但多尺度特征融合易引入冗余背景，检测头参数冗余，在井下复杂场景仍有提升空间。SSMA-YOLO：一种轻量级的 YOLO 模型，具备增强的特征提取与融合能力，适用于无人机航拍的船舶图像检测。煤矿井下环境复杂，光线差、粉尘大、目标小，传统检测模型容易漏检、误检，给矿工安全带来隐患。两大模块协同，Neck 端强化特征质量，检测头提升判别效率，

2026-05-13 09:30:55 516

原创仅 2.3M 参数！GSA-YOLO 破解电站密闭空间安全帽检测三大难题

计算机视觉研究院主要涉及深度学习领域，主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。SSMA-YOLO：一种轻量级的 YOLO 模型，具备增强的特征提取与融合能力，适用于无人机航拍的船舶图像检测。替代原 CIoU 损失，动态调整难易样本权重，弱光、模糊目标的定位精度显著提升，模型训练收敛速度更快。：轻量易部署，边缘设备实时跑参数仅 2.3M，算力需求低，完美适配现场边缘终端，真正实现。光照极端：全黑、弱光、强光混杂，图像对比度低、细节模糊，模型特征提取直接失效；

2026-05-12 09:30:55 530

原创无人机追不上 “走走停停” 的目标？这篇顶刊研究给出 65% 性能突破方案

计算机视觉研究院主要涉及深度学习领域，主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。SSMA-YOLO：一种轻量级的 YOLO 模型，具备增强的特征提取与融合能力，适用于无人机航拍的船舶图像检测。各算法跟踪精度定量结果（IoU、中心误差、HOTA、MOTA、IDF1）ViT-YOLO：基于Transformer的用于目标检测的YOLO算法。，让无人机在真实混乱场景里也能 “盯得紧、丢得少、找得快”。YOLO-S：小目标检测的轻量级、精确的类YOLO网络。

2026-05-12 09:30:55 582

原创突破 3 像素极限！YOLOv12 革新无人机极小目标检测

计算机视觉研究院主要涉及深度学习领域，主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架，提供论文一键下载，并分享实战项目。融合多头 MLP 与局部区域注意力，聚焦极小目标的局部空间依赖，摒弃全局注意力的高算力消耗，强化弱目标特征、抑制背景噪声。SSMA-YOLO：一种轻量级的 YOLO 模型，具备增强的特征提取与融合能力，适用于无人机航拍的船舶图像检测。的行业难题，在精度、速度、轻量化上实现全面突破，为无人机视觉感知提供了全新技术方案。

2026-05-11 09:30:53 504

原创 91.11% mAP！YOLOv8-L 实现奶牛行为精准识别

计算机视觉研究院主要涉及深度学习领域，主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架，提供论文一键下载，并分享实战项目。研究院会针对不同领域分享实践过程，让大家真正体会摆脱理论的真实场景，培养爱动手编程爱动脑思考的习惯！SSMA-YOLO：一种轻量级的 YOLO 模型，具备增强的特征提取与融合能力，适用于无人机航拍的船舶图像检测。标注类别：站立（950 张）、躺卧（800 张）、采食（800 张）、发情（406 张）

2026-05-11 09:30:53 528

原创无人机小目标检测封神！改进 YOLOv11n：精度暴涨 + 参数大减，边缘部署真香

计算机视觉研究院主要涉及深度学习领域，主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。SSMA-YOLO：一种轻量级的 YOLO 模型，具备增强的特征提取与融合能力，适用于无人机航拍的船舶图像检测。机场项目：解决飞行物空间大小/纵横比、速度、遮挡等问题引起的实时目标检测问题。ViT-YOLO：基于Transformer的用于目标检测的YOLO算法。无人机航拍视觉检测，正成为安防、交通、搜救、农业的核心能力。YOLO-S：小目标检测的轻量级、精确的类YOLO网络。

2026-05-09 09:58:43 591

原创人类视觉 VS 人工智能：谁更擅长 “在星点里找图案”？这项研究给出答案

计算机视觉研究院主要涉及深度学习领域，主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。SSMA-YOLO：一种轻量级的 YOLO 模型，具备增强的特征提取与融合能力，适用于无人机航拍的船舶图像检测。，可用于模糊监控、医学影像、低质图像重建等人类擅长、传统 AI 拉胯的领域。ViT-YOLO：基于Transformer的用于目标检测的YOLO算法。YOLO-TLA：一种基于 YOLOv5 的高效轻量级小目标检测模型。YOLO-S：小目标检测的轻量级、精确的类YOLO网络。

2026-05-09 09:58:43 544

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

中文语音识别模型数据集

faster-rnn目标检测

简单明了的贝叶斯网络介绍

深度学习数据集标注

深度学习工具（Caffe）

深度学习——keras

vatic安装文件

Face++技术

深度学习代码

Caffe可视化

深度学习合集

空空如也