- 博客(1786)
- 资源 (11)
- 收藏
- 关注
原创 干货 | 利用手持摄像机图像通过卷积神经网络实时进行水稻检测
点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式获取论文:关注并回复“水稻”计算机视觉研究院专栏Column of Computer Vision Institute小农户在全球粮食供应中发挥着重要作用。随着智能手机越来越普及,它们使小农能够以非常低的低成本收集图像。PART/1摘要在本研究中,研究者提出了一种有效的深度卷积神经...
2024-01-07 10:30:55
1174
原创 YoloV8与ChatGPT互通,这功能是真的强大!
点击蓝字 关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式参考地址:https://github.com/ultralytics/ultralytics计算机视觉研究院专栏Column of Computer Vision Institute现在的ChatGPT都是输入文字、图片或者语音,那如果将检测网络或者更上层一点的东西,把视觉与ChatG...
2023-07-12 08:26:47
569
转载 “大模型”研究风向变了!从这120篇顶刊顶会看最新研究趋势......
该论文提出了面向自动驾驶的 3D 占用世界模型 OccTENS,针对现有自回归占用模型存在的推理低效、长时生成时序退化和缺乏位姿可控性问题,将占用世界模型重构为时间下一尺度预测(TENS)任务,把时序序列建模拆解为空间逐层生成和时间逐帧预测,设计了 TensFormer 架构实现对占用序列时间因果性和空间关联性的灵活高效建模,并提出整体位姿聚合策略,将车辆自运动与占用信息统一序列建模,同时实现位姿可控的占用生成和自动驾驶运动规划。为方便大家研究的顺利进行,我给大家整理了目前大模型领域最热门的10大方向,
2026-03-24 10:02:23
原创 基于生成对抗网络、采用双尺度自适应高效注意力网络的高精度戴口罩人脸识别模型
嘴巴与鼻子等面部特征是人脸身份识别的关键依据,但在戴口罩人脸图像中,这些特征被口罩完全覆盖,使得戴口罩人脸识别成为一项极具难度的任务。双尺度注意力机制使模型能适应输入数据的尺度变化(如目标尺寸或分辨率差异),通过多尺度特征学习,网络可适配目标尺寸变化,同时在各类输入条件下保持稳定性能,提升口罩人脸识别模型的可靠性。)疫情期间口罩的广泛使用,凸显了戴口罩人脸识别的重要性。通过双尺度注意力层,模型可聚焦输入数据中的显著特征,同时捕捉局部与全局特征,生成更丰富、更具代表性的特征表达,提升大规模特征提取效率。
2026-03-23 12:07:17
333
原创 AWDYOLO:提升恶劣天气下自动驾驶感知的可靠性
该策略将融合过程划分为浅层融合与深层融合。值得注意的是,部分卷积(PConv)的引入使模型仅更新有效像素区域,优化了有效信息的利用,尤其在恶劣天气条件下效果显著。该策略结合双分支结构、改进的特征利用方法与注意力机制,充分挖掘预处理输入与原始输入中的目标特征信息,实现双特征的有效融合与增强。面向天气的图像增强可恢复模糊目标的细节信息,提取被误检目标的潜在特征,从而提升模型在恶劣天气场景下的鲁棒性。该策略基于浅层与深层特征的互补特性,采用差异化融合机制,以充分利用预处理输入的增强特征与原始输入的细节特征。
2026-03-20 12:45:55
437
转载 2026 多模态最值得阅读的顶会论文TOP150(CVPR/ICLR/ICML/AAAI/ACL/IJCAI)
论文提出动态多模态激活引导(DMAS)方法,通过构建语义相关的真实性引导向量数据库和视觉感知引导向量,利用多模态语义相似性动态选择适配的引导向量,靶向作用于大型视觉语言模型中负责真实性与视觉感知的不同注意力头,实现无训练的幻觉缓解。论文提出多模态大模型HouseMind,通过VQ-VAE将建筑平面图的轮廓与房间离散为空间令牌,构建融合几何与语言的统一词汇表,经多模态对齐与指令调优,实现从自然语言提示到平面图理解、生成与编辑的统一多模态推理。团队的Muddit;不要等别人把路都走通了再跟啦...
2026-03-17 12:46:11
147
原创 低空经济+电力:输电线路无人机巡检及要求
使用多旋翼无人机进行杆塔精确巡查,每天工作8小时,巡视20级杆塔,大约耗时4天,多旋翼悬停在杆塔每一层级,对该层级绝缘子、线路金具、导线与金具连接处和附属设施进行无死角精确拍照,形成杆塔本体图片数据库。利用无人机进行灾情普查工作则是一个有效的解决途径,无人机小巧轻便,无需考虑载人安全风险因素,运行使用费用低廉,环境适应能力强,可与人工巡视人员互相配合,可以快速响应及时对受灾区域杆塔本体、走廊保护区等进行巡视拍摄,节省了大量的人力物力,在抢险救灾中第一 时间搜集灾区线路数据,为制定抢修方案提供第一手资料。
2026-03-17 11:37:17
420
转载 具身智能,读这一篇就够了!
具身智能是目前人工智能领域最具潜力的研究领域之一,被誉为“人工智能的下一个浪潮”。基础视觉模型,LLM+具身智能,控制算法,基准数据集,公共数据集,必读论文列表。如果你也正在学习该领域。那么下面这份学习资料你一定要保存起来。推荐具身智能方向的小伙伴人手一份。这份资料我按照6大板块整理,分为。具身智能,有这份研究资料就够了。扫码加小助理无偿获取。
2026-03-10 09:31:05
20
转载 科技护路|湖南高速解锁“空天地”智能巡检新范式!
芒果智能科技立足湖南高速场景需求,依托自身“芒果大模型+智能体平台+超算云”的技术底座,打造专属智能巡检落地方案,以“无人机+AI+5G”为核心,构建全场景、全流程、智能化的巡检体系,为湖南高速筑牢安畅防线,推动交通基础设施数字化转型升级。:搭载自主研发的AI算法,融合深度学习与多目标跟踪技术,可精准识别路面裂缝、违规停车、边坡溜塌、护栏破损等20余类常见隐患,识别准确率超90%,事故判定准确率超99%,从隐患发生到触发报警全程不足1秒,彻底解决“漏检、误检”问题。
2026-03-05 11:32:06
31
原创 基于DIou改进的YOLO目标检测
从图中我们可以看到,GIoU在回归的过程中,从损失函数的形式我们发现,当IoU为0时,GIoU会先尽可能让anchor能够和目标框产生重叠,之后GIoU会渐渐退化成IoU回归策略,因此整个过程会非常缓慢而且存在发散的风险。文中指出DIoU要比GIou更加符合目标框回归的机制,将目标与anchor之间的距离,重叠率以及尺度都考虑进去,使得目标框回归变得更加稳定,不会像IoU和GIoU一样出现训练过程中发散等问题,并且方法能够简单地迁移到现有的算法中带来性能的提升,实验在YOLOv3上提升了5.91mAP。
2026-03-03 10:31:02
304
转载 最近爆火的全中文LLM教程,实战企业落地项目
但是LLM相关的内容很多,学校的老课程老教材关于LLM又太少。现在搞AI科研,基本上都离不开大模型。多模态大模型、大模型+时序、大模型+agent、大模型+RLHF、大模型高效应用、大模型推理。针对ChatGLM大模型,介绍ChatGLM模型微调代码实践以及模型微调。针对所有自学遇到困难的同学们,我帮大家系统梳理大模型学习脉络,并邀请。精读大模型-3论文、Instruct论文。基于模型剪枝的大模型高效计算和应用。实战基于大模型的对话系统(实战一)实战基于大模型的对话系统(实战二)
2026-02-24 11:01:47
23
原创 面向电力线场景下无人机返航任务的尺度不变逼近检测器
现有的无人机碰撞检测方法,如能耗较高的激光扫描、依赖目标可检测纹理的传统方法,或基于深度学习的电力线检测模型,仍存在显著局限。此外,本文在多种条件下评估了模型性能,并成功将其部署于无人机嵌入式板卡,开展电力线场景下的避障测试,为电力线场景中的无人机避障提供了新思路。我们的研究为复杂电线环境下的尺寸不变迫近物体检测提供了一种计算高效的解决方案,在计算机视觉和基于无人机的电线检测领域具有重要的应用潜力。此外,加法注意力机制保留了原始模型的特性,确保所提模型能够同时检测迫近的电线和常规尺寸的物体。
2026-02-22 12:02:36
975
原创 ClearSight-RS:一种基于 YOLOv5 并融合动态增强机制的遥感小目标检测网络
具体而言,传统检测模型在处理遥感图像时通常存在以下不足,这些也是遥感小目标检测的三大核心挑战:其一,小目标特征微弱,在特征传播过程中易丢失,导致其在深度网络中被淹没,漏检率较高;其三,卷积神经网络中的固定卷积核难以适应小目标的不规则轮廓,多尺度检测分支存在冗余与干扰,同时缺乏长距离依赖建模能力,也限制了对小目标全局上下文语义的捕捉。P3下采样特征作为检测输出。部署在多尺度特征融合的关键节点后,该模块不仅抑制了高层特征中背景噪声的传递,还增强了低层特征中小目标的细节响应,与动态蛇形卷积形成了互补关系。
2026-02-21 17:30:59
591
转载 无人机高空喊话警示!芒果智能 AI 巡检守护高速每一公里
无论是车辆碰撞、翻车等严重事故,还是轻微追尾、异常停车等突发情况,设备都能精准识别,通过多帧信息交叉验证排除误报,确保事故判定准确率超99%。为应对高速复杂环境挑战,解决方案采用边缘计算架构,无需依赖云端传输,在设备端即可完成数据采集、AI推理与指令执行,规避了网络延迟带来的响应滞后问题。芒果智能科技深耕AI巡检领域,打造高速场景专属智能巡检解决方案,靠“AI精准检测+秒级报警+空中喊话”三重能力,默默守护道路安全,重构高速应急处置新范式。微信号:Edison_G0701。<<< 商务合作 >>>
2026-02-19 10:31:01
41
转载 春运保畅|芒果智能无人机“空中执勤”,守护每一段归家路
无论是高速匝道、桥梁连接处,还是长下坡、隧道出入口等易拥堵点位,无人机都能精准覆盖,让导航平台第一时间更新路况信息,为司乘人员推送最优绕行路线,提前规避拥堵路段,最大化缩短归家时间,让每一位游子都能高效通行、快速抵达。为守护春运路网畅通,护航游子平安归家,芒果智能科技充分发挥无人机巡检技术优势,聚焦高速车流与路况服务核心场景,以“空中视角+智能赋能”,打造春运高速保畅“空中战队”,用科技力量为每一段归家路保驾护航,让年味不被拥堵冲淡,让团圆少一些等待。微信号:Edison_G0701。
2026-02-15 11:22:32
39
原创 一种基于YOLOv12的高效极小目标检测框架
与两阶段及基于锚框的模型相比,本模型在640×640像素的较低输入分辨率下实现更高的平均精度(AP),是面向无人机小目标与极小目标检测的高效、低计算成本框架。与Transformer式的全局自注意力不同(后者会产生较高的浮点运算量,且可能稀释空间细节),A2C2F在保持轻量计算(满足实时航空检测需求)的同时,可高效增强局部空间一致性与上下文感知表征。因此,本模型引入局部区域注意力与自适应融合模块,增强细粒度特征保留,提升对极小目标的灵敏度,实现极端小尺度条件下的精准检测。目标检测模型的一张马赛克增强样本。
2026-02-13 10:02:55
383
原创 SRTSOD-YOLO:基于改进 YOLO11 的面向无人机影像的增强型实时小目标检测算法
在广泛使用的UAVDT和VisDrone2019数据集上的实验结果表明,所提出的SRTSOD-YOLO网络在参数更少、计算成本更低的情况下,取得了更优的检测精度,显著优于基线YOLO11模型。基于深度学习框架的专用检测算法,通过优化的特征提取与空间注意力机制,在复杂低空场景中展现出了卓越的性能提升。C3K2模块的数量,所提出的SRTSOD-YOLO框架可适应不同的应用需求,衍生出四种模型变体:SRTSOD-YOLO-n、SRTSOD-YOLO-s、SRTSOD-YOLO-m和SRTSOD-YOLO-l。
2026-02-12 09:30:37
490
转载 2025时间序列各大顶会246篇论文汇总(附源码)!
通过在九个真实世界数据集上的广泛实验,SAMBA 展示了其优越的性能,证明了解耦编码策略的有效性,并为未来的时间序列预测模型设计提供了新的视角。TIMEMIXER++ 通过多尺度时间成像(MRTI)、时间图像分解(TID)、多尺度混合(MCM)和多分辨率混合(MRM)来提取全面的时间模式,能够处理多尺度时间序列,并在 8 种时间序列分析任务(包括长期预测、分类、异常检测和插补等)中达到了最先进的性能水平。涵盖多模态时序、GNN+时序、大模型+时序、KAN+时序……涵盖多模态时序、频域+时序……
2026-02-10 17:30:57
94
原创 基于YBOVDT与SAM2的交通流量统计算法研究
点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式https://pmc.ncbi.nlm.nih.gov/articles/PMC12125392/pdf/41598_2025_Article_4336.pdf计算机视觉研究院专栏Column of Computer Vision Institute在城市化进程中,交通流量统计对交通管理具有重要意义。现有交通流量统计方案存在功能不完善、对核心问题缺乏有效解决手段等不足。它们所采用的封闭集目标检测算
2026-02-08 12:03:46
915
原创 YOLO26:面向实时目标检测的关键架构优化与性能基准测试
所示,该流程始于图像或视频流形式的输入数据,首先会经过预处理操作,包括缩放与归一化,将数据调整为适合模型推理的标准尺寸。系列的最新里程碑,其设计重心从逐步增加的架构复杂度转向面向部署的简化——最突出的表现是回归流程的精简、端到端的预测行为,以及通过新型优化技术实现的训练阶段改进。的目标:在保持高检测质量的同时,降低整个流程的延迟——这一点对低功耗、对延迟敏感的边缘设备而言,是尤为关键的权衡。,原生支持端到端预测,消除了主要的后处理瓶颈,减少了延迟波动,并简化了跨部署场景的阈值调优。在回归环节,它移除了。
2026-01-30 09:30:47
1169
转载 目标检测2026年好发论文的方向!
核心创新包括:1)双语义增强通道权重分配模块(DECA)和双空间增强像素权重分配模块(DEPA),通过双重增强机制在特征空间聚合跨模态信息,减少两种模态间的相互干扰;该方法在不增加推理开销的情况下,显著提升了DETR系列模型的性能,在COCO数据集上达到了新的SOTA水平。实验表明,该方法在COCO和LVIS数据集上零样本和微调设置下均优于原始YOLO-World,在保持相当参数量和计算量的同时,AP提升0.4%-1.8%,且超越了现有开词汇检测SOTA方法。准备了配套的参考论文和源码,共145篇。
2026-01-29 09:30:59
77
原创 <span class=“js_title_inner“>YOLO-MS:重新思考实时目标检测中的多尺度表征学习(提供源代码)</span>
此外,以前的实时目标检测器大多在不同的编码器阶段采用相同的卷积(即内核大小相同的卷积),但我们认为这并不是提取多尺度语义信息的最佳选择。我们选择的目标分支是基于分支的感受野和阶段,例如,在第二阶段,左边的分支是目标分支,对应小物体。不过,大内核卷积的有效感受野较大,会对更广泛的区域进行编码,从而增加了将小物体外部的干扰信息包含进来的可能性。尽管我们所使用的构建模块在多尺度能力方面有了很大的提升,但它们并没有充分探索不同内核大小的卷积的作用,尤其是对于大内核卷积,大内核卷积在基于卷积神经网络(
2026-01-28 19:30:43
335
原创 使用新数据集评估YOLO变体在SAR图像小目标检测中的有效性
这一步的效果很大程度上取决于选择合适的窗口尺寸:在高变异性区域使用较小的窗口,在均匀区域使用较大的窗口以提高处理效率。然而,由于窗口尺寸通常在整个图像中是固定的,这可能导致异质区域的细节丢失。的方法,他们设计的模型包含一个正则化项,用于平衡从原始图像和滤波后图像中提取的特征,从而即使在高噪声数据中也能保留重要的目标信息。此外,我们的分析显示,近年来的研究中出现了越来越多使用可旋转边界框的趋势。默认配置并非专门针对小目标检测的挑战设计,尤其在几何复杂度高、对比度低的数据中,可能会限制模型的有效性。
2026-01-26 12:02:58
652
原创 基于混合深度学习模型的混凝土柱蜂窝缺陷实时检测与定位
传统蜂窝缺陷检测依赖人工目视检查,存在耗时久、主观性强、易产生人为误差等弊端,因此,研发一套高效、精准、自动化的检测方案,实现蜂窝缺陷的准确定位与识别,具有重要的现实意义。在环境影响因素愈发复杂多变的背景下,本研究提出的机器学习算法采用混合技术路线,将深度学习与优化后的传统方法相融合,以此提升检测系统的整体效率与抗干扰能力。的检测结果,将分割掩码叠加至原始图像,并高亮显示检测到的蜂窝缺陷边界框,同时展示边界框对应的置信度值以辅助可视化分析。此方法融合了蜂窝缺陷的检测与分割功能,确保了缺陷识别的高精度。
2026-01-24 17:31:37
568
原创 <span class=“js_title_inner“>基于混合深度学习模型的混凝土柱蜂窝缺陷实时检测与定位</span>
传统蜂窝缺陷检测依赖人工目视检查,存在耗时久、主观性强、易产生人为误差等弊端,因此,研发一套高效、精准、自动化的检测方案,实现蜂窝缺陷的准确定位与识别,具有重要的现实意义。在环境影响因素愈发复杂多变的背景下,本研究提出的机器学习算法采用混合技术路线,将深度学习与优化后的传统方法相融合,以此提升检测系统的整体效率与抗干扰能力。的检测结果,将分割掩码叠加至原始图像,并高亮显示检测到的蜂窝缺陷边界框,同时展示边界框对应的置信度值以辅助可视化分析。此方法融合了蜂窝缺陷的检测与分割功能,确保了缺陷识别的高精度。
2026-01-24 17:31:37
542
原创 YOLORemote:通过融合YOLOv8与CE-WA-CS特征融合方法推进遥感目标检测
在特征融合过程中,某一层级特征的上下文信息不足,会影响另一层级上下文信息的贡献度,导致最终特征表征中的整体上下文信息被稀释。因此,在特征融合过程中,有必要考虑不同层级特征间的上下文信息密度差异,并充分挖掘每个特征层级包含的信息。其次,遥感图像的背景往往复杂多样,例如密集的城市建筑与广阔的自然景观,包含大量无关物体,会产生强烈的噪声干扰。通过利用周围环境的上下文信息,模型可以更好地理解目标的位置、形状,以及它与周边环境的关系,从而补充和增强目标的特征表征,最终提升小目标检测的性能。
2026-01-23 09:30:00
625
原创 一篇文章就看懂了Ultralytics Yolo系列的演进,都到YOLO26!
1梳理了Ultralytics家族的演进路径:YOLOv5(2020)、YOLOv8(2023)、YOLO11(2024)和YOLO26(2025),重点突出设计选择、功能特性和单一供应商生态中的部署特点。相比之下,表2则梳理了独立于Ultralytics的主要社区版本,包括YOLOv1(2015)、YOLOv2(2016)、YOLOv3(2018)、YOLOv4(2020)、YOLOv6(2022)、YOLOv7(2022)、YOLOv9(2024)、YOLOv10(2024)及其同期变体。
2026-01-23 09:05:09
784
原创 基于快照式红外光谱成像仪的气体泄漏实时定量检测
由于相机是自由运行的,传输至帧聚合器的数据流是异步的,可能存在最大8ms的同步误差(即帧率的一半)。“动态校准”方法:其核心思路是,若场景中存在一个所有相机视场均能覆盖的、光谱辐射度已知的光源,那么可以利用每台相机对该光源辐射度的估算值,在图像其余部分用于测量的同时进行校准校正(详见参考文献[16])。传统的两点校准法会让每个相机的视场依次被两个快门覆盖:两个快门保持不同温度,并涂有特性明确的黑体模拟涂料,通过这两个已知的输入辐射度,可校准红外探测器的偏置信号与增益。我们先从基于光谱形状的概率估计开始。
2026-01-16 17:31:46
570
转载 又登Nature!强化学习杀疯了!
此外,系统研读了25年的几百篇顶会后,笔者还发现,对强化学习算法的优化、将其与新架构融合、对其进行验证等,也都备受审稿人青睐。想发论文的伙伴,不要错过。文章把卡尔曼滤波器嵌入深度强化学习框架,在机器人动态抓取任务中把视觉观测与隐状态估计解耦:KF 负责在线更新物体运动隐状态,策略网络据此输出抓取动作,既降低对高帧率视觉的依赖,又提升对遮挡与动态扰动的鲁棒性,在仿真和真实环境中均显著优于纯视觉 RL 基线。等机制,在无需人工标注思维链的情况下,显著提升多模态与语言模型在数学推理等多类基准上的成绩。
2026-01-15 09:31:13
92
转载 Meta再出王炸!SAM 3D彻底改变建模范式
论文提出了一种名为Segment Anything Model (SAM) 3的统一模型,该模型通过概念提示(如名词短语、图像示例或二者的组合)来检测、分割和跟踪图像和视频中的对象,并构建了一个可扩展的数据引擎,生成包含4M个独特概念标签的高质量数据集。该论文提出了一种基于大型视觉模型SAM的医学图像注释框架SAM^Med,通过SAM^assist和SAM^auto两个子模块,分别展示了SAM在下游医学分割任务中的泛化能力,并自动化生成注释 prompt,从而加速注释过程。该模型的核心能力,是让AI能够。
2026-01-13 09:31:12
105
原创 无人机搭载多向曼巴系统,对架空输电线路开展隐患识别检测
点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式文章地址:https://pmc.ncbi.nlm.nih.gov/articles/PMC12559288/pdf/41598_2025_Article_21243.pdf计算机视觉研究院专栏Column of Computer Vision Institute架空输电线路隐患检测事关电力通信系统稳定运行与社会正常运转。随着无人机技术与深度学习的发展,基于深度学习的无人机架空输电线路隐患检测方法受
2026-01-08 10:30:42
764
转载 年度总结|2025多模态领域前沿技术进展!
这篇论文提出了AlignMamba框架,通过结合最优传输(OT)的局部token级对齐和最大均值差异(MMD)的全局分布级对齐,增强了Mamba架构在多模态融合中的跨模态关系建模能力,在保持线性计算复杂度的同时显著提升了融合效果,在完整和不完整多模态任务中均达到最先进性能,同时大幅降低GPU内存使用和推理时间。尤为值得一提的是,其任务场景非常广泛、故事性强、且缺乏统一的理论框架,可发论文的着手点很多,创新空间广阔,非常推荐想快速出成果的伙伴多关注。主要聚焦多模态对齐、多模态融合等核心技术的算法、模块。
2026-01-07 09:30:39
138
原创 基于YOLO模型的在线铁轨扣件分类系统
深度学习需要一定规模的数据才能产生有效的训练结果,但本研究在数据采集方面存在特殊困难:部分缺失组件的数据难以获取,例如俯视数据中的轨面缺失样本、侧视数据集中的钢轨裂纹样本。每个部件都发挥着重要作用,其中钢轨扣件可以将铁轨固定在轨枕上,并具有缓冲作用以分散重量,从而减轻对钢轨的扰动,使钢轨能够稳定地固定在轨道上。这样一来,整体计算量大幅减少。首先需制作缺陷组件,但由于缺陷组件的制作难度较高,无法覆盖所有缺陷类别,因此俯视视角的缺陷组件主要选取弹条重度缺陷,侧视视角的缺陷组件主要选取钢轨裂纹与鱼尾板螺栓脱落。
2026-01-05 09:30:35
950
原创 西电力量·智驭长空|芒果智能科技亮相上海校友会40周年盛典,解锁低空经济新质生产力
创始人带着在西电习得的电子信息领域扎实功底,深耕无人机赛道多年,将高校实验室里的前沿探索转化为千行百业的实用解决方案——从搭载智能感知系统的工业巡检无人机,到具备协同作业能力的低空服务平台,再到适配复杂场景的定制化无人机技术,每一项产品都凝聚着“术业精湛”的西电底色,更呼应着新质生产力发展的时代需求。活动现场,芒果智能科技的无人机业务展示成为全场焦点。融合AI与通信技术的解决方案,打破了低空作业的场景边界,这与西电在通信工程、人工智能等领域的学科优势形成完美呼应,彰显了“校友-母校-产业”的协同创新生态。
2026-01-02 22:45:36
941
转载 议程发布| 庆祝西电上海校友会成立40周年!
还记得初创时骑着自行车送通信录、两毛钱菜饭黄豆汤的赤诚,如今已成长为整合资源、赋能发展的坚实平台——从创业扶持到行业交流,从情感联结到价值共创,一代代西电人带着“艰苦奋斗、自强不息”的校训基因,在集成电路、网络安全、人工智能等领域书写着“西电现象”的上海篇章。从初心萌发到薪火燎原,四代西电人躬耕上海。当校庆红遇上浦江潮,当学科优势对接时代脉搏,2025年西安电子科技大学校友新质生产力发展论坛暨西电上海校友会成立40周年大会,即将重磅启幕,邀全球西电人共赴这场跨越山海的双向奔赴!
2026-01-02 22:45:36
76
转载 中原油田 × 芒果智能:共筑电网安全防线
下一步,中原油田供电服务中心将与芒果智能科技持续深化合作,进一步优化巡检方案,拓展无人机巡检的应用场景,完善隐患排查闭环管理机制,让科技赋能贯穿电网运维全流程。中原油田供电服务中心与芒果智能科技合作的无人机巡检系统,可全天候全覆盖监测线路沿线施工区域,发现违规行为后,巡检人员通过实时画面快速定位、及时制止,并宣讲安全规范,确保施工与电网 “双安全”。中原油田供电服务中心与芒果智能科技合作,引入无人机巡检技术,结合双方场景与技术优势定制方案,重点排查电线漂浮物、鸟巢、线下施工三类隐患,推动巡检工作提质增效。
2025-12-31 21:30:37
56
原创 Focal DETR:面向 Transformer 的目标检测
DETR的其他改进集中在注意力的应用方式与目标查询的约束优化上:例如,条件DETR解耦了交叉注意力中的上下文与空间匹配区域,可解决对高质量嵌入的依赖;另一方面,若目标包含多种不同纹理的结构(例如人的衬衫与裤子),目标区域的内积和会降低,这种相对关系会影响物体信息分布的准确性。解码器中的自注意力层,与。理论上,特征图中每个令牌的查询与所有令牌键的累加和,可视为目标信息的评估值——通常,背景的评估值远小于前景。我们分别统计了目标区域和背景区域中的采样位置数量,再除以特征图上对应令牌的总数,得到它们的采样偏好。
2025-12-29 10:30:40
703
原创 融合crayfish优化算法与MNS-YOLO的太阳能电池缺陷检测方法
目前,基于深度学习的检测方法已被众多学者应用于太阳能电池缺陷检测领域,主要分为精准化与轻量化两个方向:在精准化方面,通过设计不同的网络结构与注意力机制,提升检测精度;它引入了自上而下与自下而上的双向连接,使信息能够双向传播,提升了特征的传播能力,进而改善算法性能,其结构如图。模块内置的位置编码机制,使网络在处理图像数据时能精准捕捉空间位置信息与局部特征偏差,显著提升了模型对输入特征序列顺序的敏感性,为小目标(如太阳能电池板中的微小缺陷)的精准定位提供了关键支持。随着对群体智能机制与深度学习模型的深入研究,
2025-12-27 19:30:00
1254
原创 基于自主机器人系统的土木基础设施裂缝检测
点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式https://pmc.ncbi.nlm.nih.gov/articles/PMC12349540/计算机视觉研究院专栏Column of Computer Vision Institute我们对YOLOv8n模型进行了优化,在特征融合部分引入创新的C2F-PPA模块,增强了跨尺度特征的适应性和整合能力。PART/1 概述 传统人工裂缝检测方法在效率、安全性和一致性方面常面临局限。为解决
2025-12-27 11:11:52
973
原创 一种基于改进DeepLabv3的水稻叶斑病轻量化分割模型
模块的特性捕捉更清晰的目标边界,但该模型计算成本高昂,再加上水稻病害病斑具有密集且尺寸小的特点,以及水稻生长环境复杂多变,这些都为模型的实际应用带来了新的挑战。)是由谷歌公司研发的一款轻量化卷积神经网络,旨在以尽可能少的计算资源消耗,实现高效、精准的视觉识别,因此适用于计算资源受限的田间视觉识别任务。训练过程中,通过观察模型损失的变化,以及验证集中不同病害病斑的分割评估指标,来评估模型的可行性。的分割框架中,采用了几乎完全相同的动态增强方法,证实该方法能显著提升模型在真实农业环境下的性能与泛化能力。
2025-12-26 10:31:16
1076
深度学习合集
2017-12-14
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅