自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2370)
  • 资源 (10)
  • 收藏
  • 关注

原创 2024年 车辆检测+车距检测+行人检测+车辆识别+车牌识别+车距预测(附YOLOv5和YOLOv8最新版源码)

运用yolov5进行车距检测,车辆识别,行人识别,车牌检测!

2023-01-12 22:41:44 15295 47

原创 计算机二级C语言题库(60套真题+刷题软件)2024年新题第二套

1、在数据库的三级模式中,外模式(用户模式或子模式)_____。A. 只有3个B. 只有2个C. 可以有任意多个D. 只有1个本题考查的知识点是数据库设计基础。外模式也称子模式或用户模式。它是用户的数据视图,也就是用户所见到的数据模式,它由概念模式推导而出。概念模式给出了系统全局的数据描述而外模式则给出每个用户的局部数据描述。一个概念模式可以有若干个外模式,每个用户只关心与它有关的模式,这样不仅可以屏蔽大量无关信息而且有利于数据保护。所以本题答案为C。2、在商场购物时,顾客可以购买不同的商品,而同样的商品也

2022-10-08 23:02:34 27273

原创 AI识别教程 yolov5 (穿越火线,csgo等FPS游戏识别)

该程序不需要用游戏内存数据,也不往服务器发送作弊指令,只是通过计算机视觉来分析游戏画面,定位敌人,把准星移动过去,跟人类玩家操作一模一样,因此反外挂程序无法检测到它。而且更恐怖的是这AI程序全平台通用,把操作送进去,就可以实现“枪枪爆头”。.....................

2022-04-29 19:27:35 38005 69

原创 YOLOv5改进策略|实战应用案例|YOLOv5机场安全围栏检查,破损围栏检测,YOLOv5平均精度 (AP) 提⾼了 6.9%

在当今时代,⻜机在全球交通中发挥着⾄关重要的作 ⽤。确保乘客、货物和机械的安全⾮常重要。这需要⻜机 上和机场基础设施内适当的安全机制。保护空侧等敏感区 域是机场运营商⾯临的⼀项重⼤挑战。例如,在德国,有 超过 540 个机场,其中 15 个根据 Luftverkehrsgesetz § 27d 第 1 段被归类为国际机场。为了获得此分类,机场必须遵守 § 8 Luftsicherheitsgesetz (LuftSiG),确保其敏感区域(包 括空侧)免受未经授权的访问1。

2024-05-27 19:00:00 727

原创 YOLOv8改进策略|实战应用案例| ⽤于检测内陆⽔道驳船交通的交通摄像头,船只检测 , YOLOv8、YOLOv5、SSD 和 EfficientDet 模型对比

驳船运输在物流业中发挥着举⾜轻重的作⽤,特别是在像美国这样拥有⼴泛河流系统的国家 [1]。驳船运输被认为是公路和铁路运输的⼀种环保替代⽅案,有助于减少碳排放[2]。驳船为运输⼤量 货物(例如煤炭、⾕物和⽯油产品)提供了⼀种⾼效且经济⾼效的⽅式[3]。与其他运输⽅式相⽐,⽔ 路驳船运输在安全性、可靠性和环境可持续性⽅⾯具有优势[4]。与船舶不同,作为驳船,监测⽔道上的驳船交通⾯临着巨⼤的挑战 牵引它们的设备通常不配备跟踪设备来监控它们的位置 [5]。

2024-05-27 18:45:00 380

原创 YOLOv5改进策略|实战应用案例| 通过合成数据生成和比例类别平衡技术增强小物体的物体检测性能: 工业场景中YOLOv5,YOLOv7和SSD的比较研究

中给出的SSD模型的结果表明,尽管与其他YOLO模型相比,该模型无法获得最佳结果,但使用大量合成数据并将其与真实数据样本相结合来训练模型可以影响性能并提高模型的准确性。另一方面,当合成数据样本的数量是真实数据集的一半时,SSD模型的性能最高 (与YOLOv7模型相同),这意味着将合成数据的3分之1与真实数据集的3分之2相结合,可以影响和改善SSD模型的性能,从而达到最佳效果。除了与数据生成相关联的益处之外,当与基于真实图像的合成数据相比时,使用CAD模型生成的测试一下数据在域相异度方面表现出显著的挑战。

2024-05-27 18:30:00 199

原创 2024 电工杯 B 题:大学生平衡膳食食谱的优化设计及评价 思路+matlab代码

问题 1.膳食食谱的营养分析评价及调整 1)对附件 1、附件 2 两份食谱做出全面的膳食营养评价;问题 2.基于附件 3 的日平衡膳食食谱的优化设计 1)以蛋白质氨基酸评分最大为目标建立优化模型,分别设计男生和女生的日食谱,并 对日食谱进行膳食营养评价;问题 3.基于附件 3 的周平衡膳食食谱的优化设计 在问题 2 的基础上,分别以蛋白质氨基酸评分最大、用餐费用最经济、兼顾蛋白质氨基 酸评分及经济性为目标,建立优化模型,设计男生和女生的周食谱(周一—周日),并进行 评价及比较分析。

2024-05-24 09:33:15 750

原创 2024电工杯 A 题:园区微电网风光储协调优化配置 思路+matlab代码

主电网 联合园区(园区A、B、C) Pw=1500kW PLmax=1328kW Ppv=1350kW 图 3 三个园区微电网联合接入主电网结构示意图 (Ppv、Pw、PLmax 分别为联合园区的总光伏装机容量、总风电装机容量、总负荷最大值) (1)若未配置储能,分析联合园区运行经济性,包括:联合园区的总购电 量、总弃风弃光电量、总供电成本和单位电量平均供电成本;问题 3:园区风、光、储能的协调配置方案及其经济性分析 如果园区经理委托你制定园区未来的风光储协调配置方案,并给出方案经济 性分析论证报告。

2024-05-24 09:31:32 283

原创 2024 年第六届中青杯全国大学生数学建模竞赛 B 题:药物属性预 思路+matlab代码

针对图数据,传统机器学习方法包括支持向量机(SVM)、随机森林(RF)、k-最近邻(k-NN)等。特征选择:由于提取的特征可能会很多,而且并不是所有的特征都与目标分类相关,因此进行特征选择或降维是很有必要的。可以采用如主成分分析(PCA)、线性判别分析(LDA)等方法来减少特征的维度。对于化学分子数据,可以提取的特征包括原子类型、分子量、对数配分系数(LogP)、芳香性环的数量、氢键供体和受体的数量等。分析模型表现好或不好的可能原因,对于错误分类的实例进行深入分析,以了解模型的不足之处。

2024-05-24 09:29:03 521

原创 2024 年第六届 中青杯 全国大学生数学建模竞赛 A 题:人工智能视域下养老辅助系统的构建 第二问思路

此外,通过智能化提高服务效率,可以降低部分运营成本,从而在保障服务质量的同时,维持体系的经济可持续。对于老年人的出行服务,应当实现交通工具的无障碍化改造,比如公交车和出租车应有方便老年人上下的设计,以及优先座位的规划。构建一个可持续、高效和人性化的养老体系,要求我们不仅要着眼于技术的应用,还需要考虑社会、经济以及地理等多方面的因素。比如,系统可以根据个人的健康状况、喜好和习惯,提供定制化的建议和服务。促进老年人的社会参与和心理健康管理,提供心理咨询服务,组织社区活动等,增强老年人的社会联系和生活满足感。

2024-05-24 09:20:00 27

原创 2024 年第六届 中青杯 全国大学生数学建模竞赛 A 题:人工智能视域下养老辅助系统的构建

构建一个适应不同区域和需求的老年人优化智能养老辅助系统是一个复杂且综合性的项目,下面将给出一个总体的构思框架和实施的基本思路,而详细的代码实现将根据具体功能和平台而有所不同,因此这里不提供具体的代码,而是着重于设计理念和系统架构。

2024-05-24 09:16:20 29

原创 使用YOLOv5从图像和视频进行火灾探测,火灾检测

人类需要火,因为火能提供能量。但与此同时, 意想不到的火灾会导致许多事故。根据美国国家 消防协会(NFPA)的数据,消防部门应对了全国超 过35万起房屋结构火灾,造成近70亿美元的直接 损失。为了防止这类火灾,快速探测火灾至关重 要。传统上,火灾是用传感器探测的,在每个可 能发生火灾的地方放置传感器是昂贵的,因为它 没有覆盖足够的空间,维护也很耗时。由于数码 相机技术和视频处理技术的快速发展,以计算机 视觉为基础的系统取代传统的火灾探测方法是一 个重大趋势。

2024-05-23 20:00:00 787

原创 基于YOLOv5的Robomaster EP自动辅助瞄准系统设计与实现

在Robomaster青年锦标赛的关键阶段,Robomaster EP机器 人必须完全依靠自主算法来保持竞争力。目标识别和自动 辅助瞄准是EP机器人不可缺少的功能。在本研究中,我们 使用YOLOv5进行多目标检测,以识别Robomaster EP机器 人及其装甲。此外,我们将深度排序算法集成到车辆识别 和跟踪中。因此,我们引入了一个基于yolov5的改进系统, 使机器人能够同时识别和瞄准多个目标。为了确保精确跟 踪,我们使用具有前馈增强的PID控制器和与卡尔曼滤波器 配对的FIR控制器。

2024-05-23 19:15:00 878

原创 YOLOv5s 实现车辆检测和车辆测距 多策略协同优化YOLOv5s及其在距离估计中的应用

汽车的爆炸式增长带来的事故率的上升,使 得汽车主动安全系统的研究变得越来越重要。为了实现车辆检 测和距离估计的目标,提供安全预警,提出了一种基 于新型神经网络模型(YOLOv5s-SE)的距离估计安全预 警系统(DESWS),该系统采用DIoU代替IoU,嵌入SE 注意模块,利用相似三角形原理进行距离估计。此外, 本工作还提出了一种可以根据估计的距离使用非参数 测试给出安全建议的方法。通过仿真实验,验证了 mAP提高了5.5%,能够达到基于预估距离信息给出安 全建议的目的。

2024-05-23 18:30:00 962

原创 研究视障人群室外障碍物检测的YOLOv5模型 YOLO-NAS(小、中、大)、YOLOv8、YOLOv7、YOLOv6和YOLOv5七种不同的YOLO目标检测模型

利用基于深度学习的目标检测是辅助视障人士躲避障碍物的有效方法。在本文中,我们实现 了YOLO-NAS(小、中、大)、YOLOv8、YOLOv7、YOLOv6和YOLOv5七种不同的YOLO目 标检测模型,并通过精心调优的超参数进行了综合评估,分析了这些模型在包含道路和人行 道上常见日常生活对象的图像上的表现。

2024-05-23 18:15:00 862

原创 YOLOv5 计算机视觉和算法设计的集成:中国扑克自玩机器人

本文介绍了一种中国扑克自玩机器人,它是一种集成系 统,使TM5-900机械臂能够独立玩四人牌中国扑克。该 机器人使用自定义吸盘机制来捡牌和打牌。利用基于 YOLOv5的目标检测模型识别发给机器人的花色和13张 牌的牌号。开发了一种贪心算法,将13张牌分成3、5、5 张牌的最优手牌进行出牌。实验表明,机器人可以成功 地获得这些牌,利用计算机视觉识别这些牌,利用算法 战略性地选择出牌手,并在游戏中物理地出选中的牌。该系统展示了机械设计、计算机视觉、算法设计和机器 人控制的有效集成,以完成独立出牌的复杂任务。

2024-05-23 18:00:00 694

原创 2024 年第六届中青杯全国大学生数学建模竞赛题目 C 题: “X 疾病”在人群中的传播 思路、matlab代码、python代码

X 疾病”并不代表某一种具体的疾病,而是由未知病原体引发可能导致全球大 流行的传染病,这种“未知”的病理现象,可能导致“比新冠大流行还要高 20 倍的 死亡率”,“X 疾病”最主要的特点是高致病、传播速度较快且容易变异,它的发生 发展存在很大的不确定性。完成下列四个任务: 任务 1:请设计一个包括易感者(S)、患者(I)、康复者(R)和死亡者(D) 四个群体的传染病传播模型,使用传染病传播动力学方程描述各群体之间的转变情况, 来描述“X 疾病”在人群中的传播。

2024-05-23 17:20:24 95

原创 2024 年第六届中青杯全国大学生数学建模竞赛题目 B 题:药物属性预测 思路、matlab代码、python代码

社交网络、文本文档、万维网、化学化合物和蛋白质 -蛋白质相互作用网络,通常都是用图表表示的数据的例子[2].由于图形结构的丰富数 据,图上的机器学习最近成为一项非常重要的任务。图 1 引文网络的建模示例图 第 2 页 共 2 页 1. 附件是药物分子的数据(图数据),请您利用传统方法建立药物分子的分类模 型,并给出分类精度及其结果分析。数据是 Matlab 格式,其中,am 是每个图的邻接矩阵,al 是每个节点的标签,nl 和 el 是图的其他标签。

2024-05-23 17:16:17 510 3

原创 2024 年第六届中青杯全国大学生数学建模竞赛 A 题:人工智能视域下养老辅助系统的构建 思路、matlab代码、python代码

老龄社会:老龄社会是指老年人口占总人口较大比例的社会状态,这通常意味着 社会结构和经济模式需要适应这一变化,以应对由此带来的挑战和机遇。同时,随着经济的发展和社会的进步,人们对老年生活质量的期望也在提 高,这对养老服务的质量和覆盖面提出了更高的要求。在经济较为发达的国家,政府和社会能够提供更多的资源来支持老年人的生活, 如完善的社会保障体系、高质量的医疗服务和多样化的养老服务。然而,在发展中国 家,由于经济基础薄弱,养老问题更加突出。随着科学技术的进步,人工智能技术的发展为养老问题的解决提供了新的可能性。

2024-05-23 17:09:57 138

原创 YOLOv5 图像与AIS数据融合技术在海事计算机视觉中的应用

深度学习对象检测方法,如YOLOv5,在识别海上船只方 面是有效的,但往往缺乏对实际应用重要的详细信息。在本 文中,我们通过开发一种技术来解决这个问题,该技术将自动 识别系统(AIS)数据与图像中检测到的血管融合在一起,以创 建数据集。这种融合丰富了船舶图像中与船舶相关的数据,如 类型、大小、速度和方向。我们的方法通过使用适用于固定和 周期性平移摄像机的基于同形图的方法估计距离和方位角, 将检测到的船舶与其相应的AIS信息联系起来。这种技术对 于创建用于水道交通管理、相遇检测和监视的数据集很有 用。

2024-05-23 10:54:42 997

原创 YOLOv5 基于多光谱合成图像增强深度学习的核桃检测

核桃在果园内的准确识别带来了大量的优势,深刻地 放大了核桃果园管理的效率和生产力。然而,核桃树的独特特 征,即其形状、颜色和纹理之间的密切相似的核桃和叶片,在 标注过程中精确区分它们是一个巨大的挑战。在这项研究中, 我们提出了一种提高核桃检测效率的新方法,利用YOLOv5在包 含真实和合成RGB和NIR图像的丰富图像集上进行训练。我们 对原始数据集和增强数据集的分析比较结果显示,在使用合成 图像时,检测有明显的改进。核桃产业在农业中起着至关重要的作用,凸显了其 重大的重要性。

2024-05-22 22:52:03 757

原创 YOLOv5街道塑料垃圾检测和绘图

塑料污染是一个严重的环境问题,检测和监测塑料垃圾对于减轻其影响至关重要。本文提出了绘制街道垃 圾地图的方法,主要关注塑料垃圾和垃圾桶的位置。我们的方法涉及采用深度学习技术,从安装在车辆上 的摄像头拍摄的街道图像中识别垃圾和垃圾箱。随后,我们利用热图来直观地表示整个城市的垃圾和垃圾 箱的分布。此外,我们提供了关于创建开源数据集(“pLitterStreet”)的详细信息,该数据集是在我们的方法 中开发和使用的。该数据集包含从车载相机收集的13000多张完全注释的图像,并包括边界框标签。

2024-05-22 22:47:03 931

原创 从模糊到清晰的检测:基于yolov5的空中物体检测与超分辨率

随着无人机和卫星技术的广泛使用,航空图像中精确 目标检测的需求激增。传统的目标检测模型,在偏向于大目标 的数据集上训练,很难在小的、密集聚集的目标普遍存在的空 中场景中表现最佳。为了应对这一挑战,我们提出了一种创新 的方法,将超分辨率和经过调整的轻量级YOLOv5架构相结合。采用了一系列数据集,包括VisDrone-2023、SeaDroneSee、 VEDAI和NWPU VHR-10,来评估我们的模型的性能。

2024-05-22 22:33:56 676

原创 用YOLOv5绘制昆虫3d图算法

在生态学研究中,准确收集时空位置数据是 了解昆虫和其他生物行为和生态的一项基本任务。传统上,这种追踪主要依赖于人工观察和记录位 置信息。例如,在动物行为和生态学的研究中, 经常涉及到给动物打上独特的标识符,并人工观 察它们[1]。这些数据集对于推进这些领域的发展 是无价的,但人工数据收集是耗时耗力的。此外, 标签的重量可能会影响小型或轻量级昆虫[2]的行 为,限制其实施。

2024-05-22 22:21:10 615

原创 MelNet一种用于对象检测的实时深度学习算法 yolov5、EfficientDet 和 Faster-RCNN-MobileNetv3

人们观察图像并迅速识别图像中包含的物体,辨别 它们的位置,并理解它们之间的相互作用。人类的视觉 系统表现出快速性和精确性,允许进行复杂的活动,例 如以最小的有意识思考[53]驾驶车辆。近年来,深度学习在解决目标检测、语义分割、行 人再识别、图像检索、异常检测、皮肤病诊断等挑战性 问题方面表现出了巨大的增长。在深度学习中已经定义 了各种类型的神经网络来从数据中学习抽象特征,例如 多层感知器(MLP)、卷积神经网络(CNN)、循环神经网络 (RNN)和生成对抗网络(GAN)。

2024-05-22 22:04:43 852

原创 YOLOv5 未来的智能车辆必须能够理解周围环境并安全导航 基于摄像头的车辆系统可以使用关键点和物体作为与gnss无关的SLAM和视觉里程测试的低地标和高地标

未来的智能车辆必须能够理解周围环境并安全导航。基于摄像头的车辆 系统可以使用关键点和物体作为与gnss无关的SLAM和视觉里程测试的低地标 和高地标。为此,我们提出了yolpoint,这是一种卷积神经网络模型,通过结合 YOLOv5和SuperPoint来创建一个既实时又准确的前向传递网络,同时检测图像 中的关键点和物体。通过使用共享骨干网和轻量级网络结构,yolpoint能够在 HPatches和KITTI基准测试中具有竞争力。关键点是低级的地标,通常是点、角或边缘,可以很容易地从不同的视角检索出来。

2024-05-22 21:52:46 529

原创 基于YOLOv5深度学习的无人机热图像目标检测

这项工作提出了一种神经网络模型,能够识别无人机 采集的热图像中的小而微小的物体。我们的模型由三部分组成, 骨干,颈部和预测头。骨干网是基于YOLOv5的结构,结合最后 使用变压器编码器开发的。颈部包括一个结合使用滑动窗口和 transformer的BI-FPN块,以增加输入到预测头部的信息。预测头 通过使用Sigmoid函数评估特征图来进行检测。使用具有注意力 和滑动窗口的transformer提高了识别精度,同时保持模型在合理 的参数数量和嵌入式系统的计算需求。

2024-05-22 21:28:03 679

原创 YOLOv5 非gps战场环境下的地标立体数据集识别与移动节点定位

在战场上建立无线传感器网络的一个特别重要的 应用是感知和定位沿任何轨迹移动的物体(例如防御 部队,部队,战争车辆,对手部队)[1],[2]。定位的 应用可以是跟踪节点的移动,预测其未来轨迹,有时 还可以引导节点沿着安全轨迹前进,以增加恶劣情况 下的生存能力。战场上的无线传感器网络包括但不限 于部署在英萨杰·马德里亚的几个主动和隐蔽的观察哨所或由侦察单位携带。此类传感器通常 用于探测和检查化学、生物、辐射和核(CBRN)威胁。

2024-05-22 21:15:19 636

原创 YOLO-TLA:基于YOLOv5的高效轻量级小目标检测模型

近年来,深度学习的快速发展使得计算机视觉的各 个方面都取得了重大突破,尤其是在目标检测方面。计 算机视觉的这一关键方面旨在识别和分类图像中的目标 (例如行人、动物、车辆),作为目标跟踪和目标分割等任 务的基础元素[1]、[2]。其工业应用广泛,从缺陷检测到 自动驾驶[3]-[5]。此外,电子控制系统和飞机设计的演变 凸显了基于无人机(UAV)的目标检测的重要性,在农业、 灾难等领域已经越来越普遍管理,航空摄影。无人机要么无线电控制,要么在预先 编程的路线上操作。

2024-05-22 20:59:28 238

原创 YOLOv5输电线路检测 基于网络结构优化的轻量级YOLOv5

输电线路检测技术是实现自动化监测和保障电气设施安全的关键。YOLOv5系列是 目前最先进和应用最广泛的目标检测方法之一。然而,它面临着固有的挑战,如设备上的 计算负荷高、检测精度不足等。为了解决这些问题,本文提出了一种针对移动设备定制的 增强轻量级YOLOv5技术,专门用于识别与传输线相关的对象。将C3Ghost模块集成到 YOLOv5的卷积网络中,减少特征信道融合过程中的每秒浮点运算数(FLOPs),提高特征表 达性能。此外,在YOLOv5骨干网中引入了FasterNet模块来代替c3模块。

2024-05-22 20:45:00 721

原创 YOLOv5 目标检测中的类不平衡:实验诊断与缓解策略研究

目标检测是计算机视觉中的一项关键任务,经常受到数据集不平衡的阻碍,特别是未被探索的前景-前景类不平衡问题。这 种对前景-前景类不平衡的缺乏关注,在单阶段检测器的背景下变得更加明显。本研究引入了一个利用YOLOv5单级检测器 的基准测试框架来解决前景-前景类不平衡问题。我们从COCO数据集中制作了一个新的10类长尾数据集,称为COCO-ZIPF, 专门用于反映具有有限数量对象类的常见现实检测场景。在此背景下,我们仔细研究了三种既定的技术:采样、损失称重和 数据增强。

2024-05-22 20:40:50 957

原创 基于注意力机制和fastnet的YOLOv5改进,用于铁路和航路异物检测。

随着交通系统的不断发展,关于交通基础设施的安全问题,如铁路和航空,已经变得越来越重 要。铁路和航空安全的主要威胁之一是障碍对轨道的入侵。常见的未经授权的铁路入侵包括行 人、车辆、动物和落石。未能就这些入侵及时向当局发出警报可能会对铁路交通安全和运营连 续性产生不利影响。这个问题也存在于航空业。机场跑道上的外来碎片会在飞机起降过程中对 飞机构成威胁,严重情况下会造成无法弥补的损伤[2]。早期防护外来物的方法物体对运输路线的入侵主要依靠物理屏障和人工检查。

2024-05-22 20:29:04 594

原创 YOLOv5 智能铁路道口:利用语义分割和目标检测增强安全性。

目录摘 要 1. 介 绍 2. 文献综述3. 方法基于目标检测和分割的RHGC安全框架及系统描述:基于NMS的集成方法描述增强RHGC中的目标检测基于NMS的集成模型借据计算程序为什么我们的研究采用YOLO5变体来构建RHGC安全性最终预测的集成模型:用于检测RHGC安全的接近轨道的分割技术(UNet)的体系结构描述4. 基于人工智能驱动的RHGC安全计算机视觉解决方案5. RHGC安全性数据收集6. 人工智能驱动模型在RHGC安全上的实验结果分析7. 结论和未来工作 铁 路 公 路 等 级

2024-05-22 20:15:07 874

原创 YOLOv5 一种基于应用数据集特征的分类难度轻量级度量方法

有很多信息可以用来比较神经网络模型。除了大小和速度等固有特征外,模型性 能还通过在公开数据集上的准确性来衡量。这些信息对于比较模型来说是无价的, 但它往往与预测模型在特定应用上的表现相差甚远。其中一个原因是,大多数公 共数据集都有许多类(例如,ImageNet[6]为1000,COCO[23]为80)。但许多应用程序 的类别要少得多。另一个原因是实例难度大在基准数据集和应用数据集中,数据集通常是未知的。由于这两个原因,很难从 大型公共数据集的性能推断到类别数量和类别之间相似性差异很大的特定应用程 序的性能。

2024-05-22 20:00:00 844

原创 YOLOv5 手术中x线导引丝的实时跟踪与分割,使用原始x射线图像和合成x射线图像训练一个Yolov5s检测器

导丝是每一个介入心脏病治疗过程中必不可少的工具。它们被先进到car-心血管系统,在实时x射线透视的指导下,经皮血 管进入介入的目标区域。一旦成功地完成初始导丝放置,其他导管就会在导丝之上推进,以便提供治疗,如支架置入、消融 或[1]药物输送。因此,为避免损伤血管结构,导致穿孔、剥离、中风和出血等手术并发症,导丝的精确导航是必须的。为 此,一个鲁棒的导丝跟踪和分割系统来分析连续捕获的x射线图像可以有显著的帮助,此外,减少干预医师所需的脑力劳动, 以及防止视觉疲劳[2]。

2024-05-22 19:00:00 735

原创 python机器学习 基于决策树的MNIST数字分类 详细教程 数据集+源码+远程部署

决策树是一种非常受欢迎的机器学习算法,它可以用于分类和回归任务。在基于决策树的MNIST数字分类中,算法会学习如何从手写数字的图像像素值中提取特征,并根据这些特征来决定图像表示的数字(0到9)。MNIST数据集是一个包含了手写数字的大型数据库,常用于训练各种图像处理系统。数据集包含60000个训练样本和10000个测试样本。每个样本是一个28x28像素的灰度图像。数据预处理:加载MNIST数据集,并将图像的28x28像素矩阵平展成一个长度为784的一维数组。这样每个图像就变成了一个特征向量。

2024-05-22 18:00:00 725

原创 YOLOv5 基于表型和姿态估计的番茄收获自主机器人

农业生产的劳动力短缺限制了生产规模的扩大[1]。实施自动化系统是提高生产效率的可行方案。机器人采 收的研究受到越来越多的关注,在草莓[3]、苹果[4]、甜 椒[5]、番茄[6]等作物上取得了实质性进展。广泛采用的 感知方法和收获程序可以总结为:利用监督学习将成熟度 分类为二分类,成熟度等级直接映射为可收获和不可收 获状态。一旦检测完成,通过分割模型获取目标的点云, 然后将这些云拟合成球体或圆柱体等几何形状,便于确 定作物姿态和规划适当的抓取角度。

2024-05-22 18:00:00 774

原创 YOLOv5 Flightscope:卫星图像中飞机检测算法的深度综合评估

利用热红外(TIR)和RGB相机[1]等各种类型的视觉传感器,遥感在获取地球表面信息方面起 着基础性作用。这一领域包含了广泛的技术和方法,旨在捕获、分析和解释来自各种来源 的数据。在遥感领域中,最重要的应用之一是小目标[2]的检测和定位。来自卫星图像的目 标检测在各个领域都具有非常重要的意义,例如国防和军事应用[3]、城市研究[4]、机场监 视、船舶交通监测[5]和交通基础设施确定[6,7]。

2024-05-22 16:07:07 317

原创 YOLOv5 矿石分类筛选 基于融合注意力机制的矿石分选网络

在当前全球矿产资源结构变化的大背景下,面对高品位矿石储量枯竭的挑战,采矿业不可避免地转向开发更复杂、 品位更低的矿石资源。这种转型不仅对加工技术提出了更加严格的要求,在环境保护、经济成本管理等方面也提出了 新的挑战。在这一趋势的推动下,发展高效、可持续的矿石分选技术已成为采矿业的一项紧迫任务。深度学习技术的快速发展为矿石分类和识别带来了新的可能性,特别是基于卷积神经网络(cnn)的图像分类方法。由 于其在分析和处理颜色纹理特征方面的优异性能,cnn在自动化和高效的矿石识别任务中展示了其潜力。

2024-05-22 14:25:58 891

原创 YOLOv3, YOLOv5, YOLOv6, YOLOv7和YOLOv8电动滑板车实时目标检测性能评估

电动滑板车(e-scooters)在城市地区迅速成为一种流行的交通方式,但它也带来了重大的安全挑战。在美国, 电动滑板车的兴起标志着与之相关的伤亡人数的增加,令人担忧。最近,虽然深度学习目标检测在自动驾驶 汽车中具有至关重要的意义,以避免潜在的碰撞,但其在电动滑板车背景下的应用仍相对未被探索。本文通 过评估为电动滑板车设计的尖端目标检测器的有效性和效率来解决这一差距。

2024-05-22 14:08:15 938

第20章 偏微分方程的数值解.pdf

第20章 偏微分方程的数值解

2024-05-14

数学建模的29个通用模型及matlab解法.zip

第01章 线性规划。 第02章 整数规划 第03章 非线性规划 第04章 动态规划 第05章 图与网络 第06章 排队论 第07章 对策论 第08章 层次分析法 第09章 插值与拟合 第10章 数据的统计描述和分析 第11章 方差分析 第12章 回归分析 第13章 微分方程建模 第14章 稳定状态模型 第15章 常微分方程的解法 第16章 差分方程模型 第17章 马氏链模型 第18章 变分法模型 第19章 神经网络模型 第20章 偏微分方程的数值解 第21章 目标规划 第22章 模糊数学模型 第23章 现代优化算法 第24章 时间序列模型 第25章 存贮论 第26章 经济与金融中的优化问题 第27章 生产与服务运作管理中的优化问题 第28章 灰色系统理论及其应用 第29章 多元分析 第30章 偏最小二乘回归

2024-05-14

yolo猫狗识别数据集,YOLO动物识别数据集,包括训练好的yolov5模型,包含几千张jpg和对应的txt文件

支持['bird','cat', 'cow', 'dog', 'horse', 'sheep']6种动物的检测 yolo猫狗识别数据集,YOLO动物识别数据集,包括训练好的yolov5模型,包含几千张jpg和对应的txt文件 支持['bird','cat', 'cow', 'dog', 'horse', 'sheep']6种动物的检测 yolo猫狗识别数据集,YOLO动物识别数据集,包括训练好的yolov5模型,包含几千张jpg和对应的txt文件 支持['bird','cat', 'cow', 'dog', 'horse', 'sheep']6种动物的检测 yolo猫狗识别数据集,YOLO动物识别数据集,包括训练好的yolov5模型,包含几千张jpg和对应的txt文件 支持['bird','cat', 'cow', 'dog', 'horse', 'sheep']6种动物的检测 yolo猫狗识别数据集,YOLO动物识别数据集,包括训练好的yolov5模型,包含几千张jpg和对应的txt文件

2024-05-09

Squeezed Edge YOLO:边缘设备上的板载对象检测

由于其在自主导航中的关键作用,对高效车载物体检测的需求正在增加。然而,由于 YOLO 等资源受限的边缘设备上的计算要求很高,因此在此类模型上部署此类检测模型具有挑战性。本文研究了一种名为Squeezed Edge YOLO的压缩目标检测模型。该模型被压缩和优化为千字节的参数,以适应此类边缘设备的板载。为了评估 Squeezed Edge YOLO,使用了两个用例 - 人体和形状检测 - 来展示模型的准确性和性能。此外,该模型还部署在具有 8 个 RISC-V 内核的 GAP8 处理器和具有 4GB 内存的 NVIDIA Jetson Nano 上。实验结果表明,Squeezed Edge YOLO模型尺寸优化了8倍,能效提高了76%,整个过程提高了3.3倍。

2024-04-11

奥地利自动驾驶深度学习视觉模型YOLO和DETR的首次定性观察

本研究探讨了单阶段和两阶段二维目标检测算法的应用,如你只看一次(YOLO)、实时设计模型(RT-DETR)算法在自动物体检测中的应用,以提高奥地利道路上自动驾驶的道路安全性。YOLO算法是一种最先进的实时物体检测系统,以其效率和准确性而闻名。在驾驶环境中,其快速识别和跟踪物体的潜力对于高级驾驶辅助系统(ADAS)和自动驾驶汽车至关重要。该研究的重点是奥地利的道路状况和交通情况带来的独特挑战。该国多样化的景观、不同的天气条件和特定的交通法规需要一种量身定制的方法来进行可靠的物体检测。该研究利用了一个选择性数据集,包括在奥地利道路上拍摄的图像和视频,包括城市、农村和高山环境。

2024-04-11

使用YOLO从SDSS图像中检测到边缘低表面亮度星系候选星系

低表面亮度星系(LSBG)是星系群中较暗的成员,被认为是众多的。然而,由于它们的表面亮度低,寻找广域LSBGs样本是困难的,这反过来又限制了我们充分了解星系的形成和演化以及星系关系的能力。边缘LSBG由于其独特的方向,为研究星系结构和星系成分提供了极好的机会。在这项工作中,我们利用You Only Look Once目标检测算法,通过在斯隆数字巡天(SDSS)中训练281个边缘LSBG来构建边缘LSBG检测模型gri-波段合成图像。该模型在测试集上的召回率为94.64%,纯度为95.38%。我们搜索了 938,046gri来自 SDSS 数据发布 16 的波段图像,发现了 52,293 个候选 LSBG。为了提高候选LSBG的纯度并减少污染,我们采用了深度支持向量数据描述算法来识别候选样品中的异常。最终,我们编制了一个包含 40,759 个边缘 LSBG 候选药物的目录。该样本与训练数据集具有相似的特征,主要由蓝色边缘的 LSBG 候选者组成。该目录可通过此 https URL 在线获取。

2024-04-11

yolo使用TomFormer及早准确检测番茄叶病

番茄叶病对番茄种植者构成了重大挑战,导致作物产量大幅下降。及时准确地识别番茄叶病对于成功实施病害管理策略至关重要。本文介绍了一种基于变压器的模型,称为TomFormer,用于番茄叶病检测。该论文的主要贡献包括以下几点:首先,我们提出了一种检测番茄叶病的新方法,即采用结合视觉转换器和卷积神经网络的融合模型。其次,我们的目标是将我们提出的方法应用于Hello Stretch机器人,以实现番茄叶病的实时诊断。第三,我们通过将我们的方法与 YOLOS、DETR、ViT 和 Swin 等模型进行比较来评估我们的方法,证明其能够实现最先进的结果。为了进行实验,我们使用了三个番茄叶病数据集,即 KUTomaDATA、PlantDoc 和 PlanVillage,其中 KUTomaDATA 是从阿联酋阿布扎比的一个温室收集的。最后,我们对模型的性能进行了全面分析,并彻底讨论了我们方法固有的局限性。TomFormer 在 KUTomaDATA、PlantDoc 和 PlantVillage 数据集上表现良好,平均准确率 (mAP) 得分分别为 87%、81% 和 83%。mAP的比较结果表明,我们的方法

2024-04-11

具有混合注意力特征金字塔网络的YOLO算法,用于焊点缺陷检测

传统的人工检测焊点缺陷在工业生产中不再适用,因为效率低、评估不一致、成本高、缺乏实时数据。针对工业场景表面贴装技术中焊点缺陷检测精度低、误检率高、计算成本高等问题,提出了一种新的方法。所提出的解决方案是专门为焊点缺陷检测算法设计的混合注意力机制,通过提高精度同时降低计算成本来改善制造过程中的质量控制。混合注意力机制包括一种增强的多头自注意力和协调注意力机制,增加了注意力网络感知上下文信息的能力,并增强了网络特征的利用范围。坐标注意力机制增强了不同通道之间的连接,减少了位置信息丢失。混合注意力机制增强了网络感知远距离位置信息和学习局部特征的能力。改进后的算法模型对焊点缺陷检测具有较好的检测能力,mAP达到91.5%,比“只看一次”第5版算法高4.3%,优于其他对比算法。与其他版本相比,平均平均精度、精度、召回率和每秒帧数指标也有所改进。在满足实时检测要求的同时,可以提高检测精度。

2024-04-11

DiffYOLO:通过YOLO和扩散模型进行抗噪声目标检测

以YOLO系列为代表的目标检测模型得到了广泛的应用,并在高质量的数据集上取得了很好的成绩,但并不是所有的工作条件都是理想的。为了解决在低质量数据集上定位目标的问题,现有方法要么训练新的目标检测网络,要么需要大量低质量数据集进行训练。然而,我们在本文中提出了一个框架,并将其应用于称为 DiffYOLO 的 YOLO 模型。具体来说,我们从去噪扩散概率模型中提取特征图,以增强训练有素的模型,这使我们能够在高质量数据集上微调YOLO,并在低质量数据集上进行测试。结果证明,该框架不仅可以证明在噪声数据集上的性能,还可以证明在高质量测试数据集上的检测结果。我们稍后将补充更多的实验(使用各种数据集和网络架构)。

2024-04-11

YOLOv7无人机实时探测人体

计算机视觉和遥感中最重要的问题之一是物体检测,它可以识别图片中不同事物的特定类别。公共安全的两个关键数据来源是无人驾驶飞行器(UAV)产生的热红外(TIR)遥感多场景照片和视频。由于目标尺度小,场景信息复杂,相对于可观看视频的分辨率较低,并且缺乏公开可用的标记数据集和训练模型,因此其目标检测过程仍然很困难。本研究提出了一种用于图片和视频的UAV TIR目标检测框架。用于收集地面TIR照片和视频的前视红外(FLIR)相机用于创建基于CNN架构的“你只看一次”(YOLO)模型。结果表明,在验证任务中,使用YOLOv7(YOLO版本7)最先进的模型\cite{1},检测人体的平均精度为IOU(Intersection over Union)= 0.5,为72.5%,而检测速度约为161帧/秒(FPS/秒)。该应用展示了YOLO架构的实用性,该应用根据YOLOv7模型从各种无人机的观察角度评估了无人机TIR视频中人员的交叉检测性能。本工作对使用深度学习模型的TIR图片和视频目标检测进行定性和定量评估得到了有利的支持。

2024-04-11

使用 YOLO 对牛栏编号进行分类

本文介绍了CowStallNumbers数据集,该数据集是从奶牛视频中提取的图像集合,旨在推进奶牛摊位数量检测领域。该数据集包括 1042 张训练图像和 261 张测试图像,摊位数范围为 0 到 60。为了增强数据集,我们对YOLO模型进行了微调,并应用了数据增强技术,包括随机裁剪、中心裁剪和随机旋转。实验结果表明,识别失速数的准确率为95.4%。

2024-04-11

YOLO-Former:YOLO与ViT握手

所提出的YOLO-Former方法将Transformer和YOLOv4的思想无缝集成,创建了一个高精度、高效率的目标检测系统。该方法利用了 YOLOv4 的快速推理速度,并通过集成卷积注意力和 transformer 模块,融合了 transformer 架构的优势。结果验证了所提方法的有效性,在Pascal VOC数据集上的平均精度(mAP)为85.76\%,同时保持了较高的预测速度,帧速率为每秒10.85帧。这项工作的贡献在于展示了这两种最先进技术的创新组合如何导致目标检测领域的进一步改进。

2024-04-11

使用 YOLOv7 和 ESRGAN 改进坑洼检测

坑洼是常见的道路危险,会对车辆造成损坏并给驾驶员带来安全风险。卷积神经网络(CNN)的引入在业界广泛用于基于深度学习方法的目标检测,并在硬件改进和软件实现方面取得了重大进展。在本文中,提出了一种独特的更好算法,以保证使用低分辨率相机或低分辨率图像和视频源,通过超分辨率生成对抗网络(SRGAN)使用超分辨率(SR)进行自动坑洼检测。然后,我们继续使用 You Only Look Once (YOLO) 网络(即 YOLOv7 网络)在低质量和高质量行车记录仪图像上建立基线坑洼检测性能。然后,我们说明并检查了在对低质量图像进行放大实施后,在基准之上获得的速度和准确性。

2024-04-11

基于YOLO的动态序列匹配模型,实现高效的无覆盖图像隐写

许多现有的无封面隐写术方法在封面图像和隐藏数据之间建立了映射关系。存在一个问题,即存储在数据库中的图像数量会随着隐写能力的增加而呈指数增长。对高隐写能力的需求使得构建图像数据库具有挑战性。为了提高隐写系统的图像库利用率和抗攻击能力,我们提出了一种基于动态匹配子串的高效无覆盖方案。YOLO用于选择最优对象,并在这些对象和加扰因子之间建立映射字典。借助该字典,每个图像都被有效地分配给特定的加扰因子,该因子用于加扰接收器的序列键。为了在有限的图像库中实现足够的隐写能力,加扰序列的所有子串都具有隐藏数据的潜力。完成秘密信息匹配后,将从数据库中获得理想数量的stego图像。实验结果表明,该技术在数据负载、传输安全性、隐藏能力等方面优于以往大多数工作。在典型的几何攻击下,它平均可以恢复79.85%的秘密信息。此外,只需要大约 200 个随机图像即可满足每个图像 19 位的容量。

2024-04-11

基于深度学习的综合感知与通信系统中的目标-用户关联

在集成传感和通信 (ISAC) 系统中,将雷达目标与通信用户设备 (UE) 相匹配可用于多种通信任务,例如主动切换和波束预测。在本文中,我们考虑了一种雷达辅助通信系统,其中基站(BS)配备了具有双重目标的多输入多输出(MIMO)雷达:(i)将车载雷达目标与通信波束空间中的车载设备(VE)相关联,以及(ii)根据雷达数据预测每个VE的波束成形矢量。建议的目标用户 (T2U) 关联包括两个阶段。首先,从距角图像中检测车辆雷达目标,并估计每个目标的波束成形矢量。然后,将推断出的每目标波束成形矢量与BS上用于通信的波束成形矢量进行匹配,以执行目标到用户(T2U)关联。通过修改“只看一次”(YOLO)模型,在模拟的距离角度雷达图像上进行训练,从而获得联合多目标检测和波束推理。不同城市车辆出行情景下的仿真结果表明,所提T2U方法提供了随BS天线阵列尺寸增加而增加的正确关联概率,突出了波束空间中VE可分离性的相应增加。此外,我们表明,改进后的YOLO架构可以有效地进行波束预测和雷达目标检测,在不同天线阵列尺寸下,后者的平均精度相似。

2024-04-11

使用基于YOLO的学习方法对农业进行实时目标检测和机器人操作

优化普通种植作物的作物收获过程对于农业产业化的目标具有重要意义。如今,机器视觉的利用使农作物的自动识别成为可能,从而提高了收割效率,但挑战仍然存在。本研究提出了一个新框架,该框架结合了卷积神经网络(CNN)的两个独立架构,以便在模拟环境中同时完成作物检测和收获(机器人操作)的任务。模拟环境中的裁剪图像会进行随机旋转、裁剪、亮度和对比度调整,以创建用于数据集生成的增强图像。“你只看一次”算法框架与传统的矩形边界框一起使用,用于作物定位。随后,所提出的方法通过视觉几何组模型利用获取的图像数据,以揭示机器人操作的抓取位置。

2024-04-11

YOLO-World:实时开放词汇对象检测

You Only Look Once (YOLO) 系列探测器已成为高效实用的工具。但是,它们对预定义和训练对象类别的依赖限制了它们在开放场景中的适用性。为了解决这一局限性,我们引入了 YOLO-World,这是一种创新方法,通过视觉语言建模和大规模数据集的预训练,增强了 YOLO 的开放词汇检测功能。具体而言,我们提出了一种新的可重新参数化的视觉-语言路径聚合网络(RepVL-PAN)和区域-文本对比损失,以促进视觉和语言信息之间的交互。我们的方法擅长以零射程、高效率检测各种物体。在具有挑战性的 LVIS 数据集上,YOLO-World 在 V100 上以 52.0 FPS 实现了 35.4 AP,在准确性和速度方面都优于许多最先进的方法。此外,经过微调的 YOLO-World 在多个下游任务上取得了出色的性能,包括对象检测和开放词汇实例分割。

2024-04-11

基于YOLO的红外小目标检测范式

在计算机视觉中,检测红外图像中从小到小的目标是一项具有挑战性的任务,尤其是在将这些目标与嘈杂或有纹理的背景区分开来时。与分割神经网络相比,YOLO 等传统目标检测方法难以检测微小目标,导致检测小目标时性能较弱。为了在保持高检测率的同时减少误报的数量,我们引入了反之亦然YOLO检测器训练的决策标准。后者利用了出乎意料的小目标,以区分他们与复杂背景。将这一统计标准添加到YOLOv7-tine中,弥合了用于红外小目标检测和目标检测网络的最先进的分割方法之间的性能差距。它还显著提高了YOLO在少镜头设置下的鲁棒性。

2024-04-11

使用YOLO v7在磁共振成像中检测肾脏

简介 本研究探讨了使用最新的 You Only Look Once (YOLO V7) 物体检测方法,通过训练和测试医学图像格式上的改进 YOLO V7,来增强医学成像中的肾脏检测。方法 研究纳入878例肾细胞癌(RCC)不同亚型患者和206例肾脏正常患者。共检索到1084例患者的5657次MRI扫描。从回顾性维护的数据库中招募了 326 名患者,涉及 1034 个肿瘤,并在他们的肿瘤周围绘制了边界框。在 80% 的注释案例上训练了主要模型,其中 20% 用于测试(主要测试集)。然后使用最佳主要模型来识别其余 861 名患者的肿瘤,并使用该模型在他们的扫描中生成边界框坐标。创建了 10 个基准训练集,其中包含未分段患者的生成坐标。用于预测主要测试集中肾脏的最终模型。我们报告了阳性预测值(PPV)、灵敏度和平均精密度(mAP)。结果 初级训练集的平均PPV为0.94 +/- 0.01,灵敏度为0.87 +/- 0.04,mAP为0.91 +/- 0.02。最佳主要模型的 PPV 为 0.97,灵敏度为 0.92,mAP 为 0.95。最终模型的平均 PPV 为 0.95 +/- 0.03

2024-04-11

YOLO-CIANNA:在无线电数据中进行深度学习的星系检测 I. 一种受YOLO启发的新型源检测方法应用于SKAO SDC1

即将到来的平方公里阵列(SKA)将为天文仪器产生的数据量设定一个新标准,这可能会挑战广泛采用的数据分析工具,这些工具无法与数据大小进行充分扩展。本研究旨在通过应用现代深度学习目标检测技术,为海量射电天文数据集开发一种新的源检测和表征方法。这些方法已经证明了它们在复杂的计算机视觉任务中的效率,我们试图确定它们在应用于天文数据时的具体优势和劣势。我们介绍了YOLO-CIANNA,这是一款专为天文数据集设计的高度定制的深度学习目标探测器。本文介绍了该方法,并描述了解决射电天文图像特定挑战所需的所有低级适应。我们使用来自 SKAO SDC1 数据集的模拟 2D 连续体图像演示了这种方法的功能。我们的方法优于特定 SDC1 数据集上所有其他已发表的结果。使用 SDC1 指标,我们将挑战获胜分数提高了 +139\%,将唯一其他挑战后参与的分数提高了 +61\%。我们的目录的检测纯度为 94%,同时检测的来源比以前的最高分结果多 40 至 60%。经过训练的模型还可以强制在后处理中达到 99% 的纯度,并且仍然比其他高分方法多检测 10% 到 30% 的来源。它还能够实时检测,在单个 GPU 上每秒

2024-04-11

YOLO-Ant:通过深度可分离卷积和大核设计实现天线干扰源检测的轻量级探测器

在5G通信时代,消除影响通信的干扰源是一项资源密集型任务。计算机视觉的快速发展使无人机能够执行各种高空探测任务。由于天线干扰源的目标检测领域尚未得到充分探索,因此该行业缺乏针对该特定任务的专用学习样本和检测模型。本文创建了一个天线数据集,以解决重要的天线干扰源检测问题,并作为后续研究的基础。我们介绍了YOLO-Ant,这是一款专为天线干扰源检测而设计的轻量级CNN和变压器混合探测器。具体来说,我们最初为网络深度和宽度制定了轻量级设计,确保后续研究在轻量级框架内进行。然后,提出了一种基于深度可分离卷积和大卷积核的DSLK-Block模块,以增强网络的特征提取能力,有效提高小目标检测能力。为了解决天线检测中复杂的背景和较大的类间差异等挑战,我们构建了DSLKVit-Block,这是一个强大的特征提取模块,结合了DSLK-Block和变压器结构。考虑到其轻量级设计和精度,该方法不仅在天线数据集上实现了最佳性能,而且在公共数据集上也取得了具有竞争力的结果。

2024-04-11

YOLO-TLA:基于YOLOv5的高效轻量级小目标检测模型

目标检测是计算机视觉的一个关键方面,在准确性和鲁棒性方面取得了重大进展。尽管取得了这些进步,但实际应用仍然面临明显的挑战,主要是对小物体的不准确检测或漏检。在本文中,我们提出了基于YOLOv5的高级目标检测模型YOLO-TLA。我们首先在颈部网络金字塔架构中引入了一个额外的小物体检测层,从而生成了更大比例的特征图,以识别小物体的更精细特征。此外,我们将C3CrossCovn模块集成到骨干网中。该模块使用滑动窗口特征提取,有效地最小化了计算需求和参数数量,使模型更加紧凑。此外,我们还将全球关注机制纳入骨干网络。该机制将通道信息与全局信息相结合,以创建加权特征图。此特征图经过定制,可突出显示感兴趣对象的属性,同时有效地忽略不相关的细节。与基线YOLOv5s模型相比,我们新开发的YOLO-TLA模型在MS COCO验证数据集上显示出相当大的改进,在mAP@0.5中增加了4.6%,在mAP@0.5:0.95中增加了4%,同时将模型大小紧凑地保持在9.49M参数。进一步将这些改进扩展到 YOLOv5m 模型,增强版的 mAP@0.5 和 mAP@0.5:0.95 分别增加了 1.7% 和 1.9

2024-04-11

DEYO:带有 YOLO 的 DETR 用于端到端目标检测

DETR 的训练范式很大程度上取决于在 ImageNet 数据集上预训练它们的骨干。然而,图像分类任务和一对一匹配策略提供的有限监督信号导致 DETR 的颈部预训练不足。此外,训练早期匹配的不稳定性导致DETR的优化目标不一致。为了解决这些问题,我们设计了一种创新的培训方法,称为分步培训。具体来说,在训练的第一阶段,我们采用经典的检测器,用一对多匹配策略进行预训练,以初始化端到端检测器的骨干和颈部。在训练的第二阶段,我们冻结了端到端检测器的骨干和颈部,因此需要从头开始训练解码器。通过分步训练的应用,我们引入了第一个实时端到端目标检测模型,该模型利用纯卷积结构编码器 DETR with YOLO (DEYO)。在不依赖任何补充训练数据的情况下,DEYO在速度和准确性上都超过了所有现有的实时目标检测器。此外,全面的 DEYO 系列可以使用单个 8GB RTX 4060 GPU 完成其对 COCO 数据集的第二阶段训练,从而大大降低了训练支出。源代码和预训练模型可在此 https URL 上找到。

2024-04-11

第25章 存贮论.pdf

第25章 存贮论

2024-05-14

第30章 偏最小二乘回归.pdf

第30章 偏最小二乘回归

2024-05-14

第28章 灰色系统理论及其应用.pdf

第28章 灰色系统理论及其应用

2024-05-14

第21章 目标规划.pdf

第21章 目标规划

2024-05-14

第23章 现代优化算法.pdf

第23章 现代优化算法

2024-05-14

第19章 神经网络模型.pdf

第19章 神经网络模型

2024-05-14

第16章 差分方程模型.pdf

第16章 差分方程模型

2024-05-14

第13章 微分方程建模.pdf

第13章 微分方程建模

2024-05-14

第12章 回归分析.pdf

第12章 回归分析

2024-05-14

第14章 稳定状态模型.pdf

第14章 稳定状态模型

2024-05-14

第11章 方差分析.pdf

第11章 方差分析

2024-05-14

第07章 对策论.pdf

第07章 对策论

2024-05-14

第08章 层次分析法.pdf

第08章 层次分析法

2024-05-14

第09章 插值与拟合.pdf

第09章 插值与拟合

2024-05-14

第04章 动态规划.pdf

第04章 动态规划

2024-05-14

第06章 排队论.pdf

第06章 排队论

2024-05-14

第05章 图与网络.pdf

第05章 图与网络

2024-05-14

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除