深度学习
文章平均质量分 82
Deep Learning学习笔记
Color Space
Q3252314061, 公众号:OpenCV与AI深度学习
展开
-
实战 | YOLOv10 自定义数据集训练实现车牌检测 (数据集+训练+预测 保姆级教程)
例如,在 COCO 数据集上,YOLOv10-S 的速度是 RT-DETR-R18 的 1.8 倍,而 YOLOv10-B 与 YOLOv9-C 相比,在性能相同的条件下,延迟浏览器打开 46%,参数浏览器打开 25%。YOLOv10是清华大学研究人员在Ultralytics Python包的基础上,引入了一种新的实时目标检测方法,解决了YOLO以前版本在后处理和模型架构方面的不足。YOLOv10中的主干网负责特征提取,它使用了增强版的CSPNet(跨阶段部分网络),以改善梯度流并减少计算能力。原创 2024-06-08 21:00:12 · 2080 阅读 · 0 评论 -
基于OpenVINO实现无监督异常检测
下面的函数run_inference()将以 FiftyOne 样本集合(例如我们的测试集)作为输入,以及推理器对象和用于将结果存储在样本中的键。在此示例中,我们将使用 0.5 的阈值,但您可以尝试使用不同的值。然而,视觉异常检测对于检测制造中的缺陷、识别监控录像中的可疑活动以及检测医学图像中的异常至关重要。train_and_export_model()下面的函数使用 Anomalib 的类训练异常检测模型Engine,将模型导出到 OpenVINO,并返回模型“推理器”对象。我们将重点关注的对象类别。原创 2024-06-08 20:58:03 · 1487 阅读 · 0 评论 -
AI一键换衣:开源虚拟试穿项目IDM-VTON介绍与使用
对时尚设计师和零售商而言,在电子商务网站线上提供试穿服务,不仅能够降低库存成本,提高销售效率,提升购物体验和客户满意度,协助时尚设计师预览新设计在不同体型上的效果,还能减少实体试衣间的需求,从而节省空间和运营成本。使用两个不同的模组来编码服装图像的语义,给定扩散模型的基础 UNet,将从视觉编码器提取的高级语义融合到交叉注意力层,进一步提升影像的细节品质。IDM-VTON 透过分析人物和服装的图像,即使在复杂背景和多样姿势下,IDM-VTON 也能保持服装的细节特征,产生逼真的试穿效果。原创 2024-06-08 20:54:52 · 708 阅读 · 0 评论 -
实战 | 通过微调SegFormer改进车道检测效果(数据集 + 源码)
在本次实验中,我们利用 BDD(Berkeley DeepDrive)车道检测数据集提供的丰富多样的数据,成功展示了微调的 SegFormer 模型在车道检测任务中的应用。这种方法凸显了微调的有效性以及 SegFormer 架构在处理自动驾驶和道路安全中的复杂语义分割任务时的稳健性,即使在漆黑的夜晚也是如此。车道检测的流畅性和准确性(在叠加的绿色蒙版中可视化)证明了该模型的有效性。最后,可以肯定的是,即使有多种尖端的车道检测算法,对 SegFormer 这样的模型进行微调也能获得出色的结果!原创 2024-06-08 20:51:57 · 997 阅读 · 0 评论 -
YOLOv8自定义数据集训练实现火焰和烟雾检测
在本例中,图像文件位于/content/drive/MyDrive/D-Fire/runs/detect/train/confusion_matrix.png.该width=600参数将显示图像的宽度设置为600像素,它控制显示时图像的大小。例如,如果您的 Google 云端硬盘中有一个文件,您可以使用路径“/content/drive/MyDrive/”引用该文件,后跟该文件在 Google 云端硬盘目录结构中的位置。该文件可能包含有关数据集的信息,例如图像的路径和相应的对象标签。原创 2024-05-27 21:20:50 · 895 阅读 · 1 评论 -
实战 | 使用YoloV8实例分割识别猪的姿态(含数据集)
epoch 的数量主要取决于您愿意等待多长时间,epoch 越多,结果越好,但是,总有一个点是无法实现任何改进的,因此从 100 个 epoch 开始似乎是个好主意。使用 Yolov8 时,可以记录某一类别的猪的数量(例如正在进食的猪),这样您就可以随时统计猪的数量。如果您不熟悉虚拟环境,虚拟环境的目的是将当前项目中安装的包与计算机上的其他项目分开,这样您就可以避免项目之间的版本不匹配。以及 dataset.yaml 文件的路径,它指向我们的数据、标签和要识别的类的数量。确保路径与您在计算机上的期望相符。原创 2024-05-27 21:18:12 · 1189 阅读 · 10 评论 -
YOLOv10介绍与推理--图片和视频演示(附源码)
例如,在 COCO 数据集上,YOLOv10-S 的速度是RT-DETR-R18 的 1.8 倍,而 YOLOv10-B 与 YOLOv9-C 相比,在性能相同的情况下,延迟减少了 46%,参数减少了 25%。YOLOv10是清华大学的研究人员在Ultralytics Python包的基础上,引入了一种新的实时目标检测方法,解决了YOLO 以前版本在后处理和模型架构方面的不足。然而,对 NMS 的依赖和架构上的低效阻碍了最佳性能的实现。利用一致的双重分配来消除对 NMS 的需求,从而减少推理延迟。原创 2024-05-27 21:16:14 · 4464 阅读 · 0 评论 -
实战 | 微调训练TrOCR识别弯曲文本
TrOCR(基于 Transformer 的光学字符识别)模型是性能最佳的 OCR 模型之一。在我们之前的文章中,我们分析了它们在单行打印和手写文本上的表现。原创 2024-03-25 19:07:47 · 2175 阅读 · 0 评论 -
TrOCR—基于Transformer的OCR入门
多年来,光学字符识别 (OCR) 出现了多项创新。它对零售、医疗保健、银行和许多其他行业的影响是巨大的。尽管有着悠久的历史和多种最先进的模型,研究人员仍在不断创新。与深度学习的许多其他领域一样,OCR 也看到了变压器神经网络的重要性和影响。如今,我们拥有像。原创 2024-03-25 19:04:10 · 1569 阅读 · 0 评论 -
开源项目 | 用AI给人像照片换发型和发色(附详细步骤 + 避坑指南)
我们新颖的表示方法能够从多个参考图像中传输视觉属性,包括痣和皱纹等特定细节,并且因为我们在潜在空间中进行图像混合,所以我们能够合成连贯的图像。我们的方法避免了其他方法中存在的混合伪影,并找到全局一致的图像。源码中是用yaml直接创建环境,environment/environment.yaml ,这里我们需要将environment.yaml文件中需要pip的包复制出来,粘贴进新建的一个requirements.txt中,这里我已经在本地电脑建好,直接上传到Barbershop根目录。原创 2024-02-02 20:56:48 · 4086 阅读 · 0 评论 -
基于YOLOv8 + BotSORT实现球员和足球检测与跟踪 (步骤 + 源码)
本文旨在了解 YOLO 架构并在自定义数据集上对其进行训练,然后微调模型以获得更好的结果,并运行推理以了解最有效的方法。原创 2024-01-09 22:24:21 · 1549 阅读 · 1 评论 -
基于OpenCV+YOLOv5实现车辆跟踪与计数(附源码)
注意:这里为什么不直接用count += 1来计算数量?如果用count += 1会造成很多重复计数,而代码中利用了python集合的特性,add函数添加元素时,如果元素已经存在,则不重复添加,有效的避免了重复计数问题。此时将车辆id编号添加到集合area_1中,然后通过len(area_1)作为车辆计数值。【3】计数原理:判断绿色点是否在黄色四边形内,如果在内计数+1。【1】划定一个多边形区域(黄色),车辆经过此区域则计数;tracker.py代码:。main.py代码:。原创 2023-11-27 21:01:24 · 965 阅读 · 0 评论 -
使用YOLOv8做目标检测、实例分割和图像分类
本文主要介绍YOLOv8及使用它做目标检测、实例分割和图像分类演示,仅供参考。翻译 2023-02-07 21:08:44 · 32072 阅读 · 5 评论 -
PaddleSeg图像分割预测pyinstaller打包报错:No module named ‘framework_pb2‘,问题解决
No module named 'framework_pb2',问题解决原创 2023-01-29 17:02:21 · 3351 阅读 · 2 评论 -
15个目标检测开源数据集汇总
目标检测应当在这几年当中研究数量以及应用范围最广的一个领域,也持续的受到很多深度学习者们的关注。本文收集和整理了15个目标检测相关的开源数据集,希望能给大家的学习带来帮助。转载 2023-01-02 12:08:20 · 1175 阅读 · 0 评论 -
手把手教你用Python和OpenCV搭建一个半自动标注工具(详细步骤 + 源码)
本文将手把手教你用Python和OpenCV搭建一个半自动标注工具(包含详细步骤 + 源码)。原创 2023-01-01 22:39:32 · 3272 阅读 · 2 评论 -
干货 | YOLOv7目标检测论文解读与推理演示
本文主要介绍简化的YOLOv7论文解读和推理测试以及YOLOv7与 YOLO系列的其他目标检测器的比较。翻译 2022-08-13 20:29:54 · 5404 阅读 · 1 评论 -
基于深度学习的路面坑洞检测(详细教程)
本文主要介绍如何使用YOLOv4 目标检测模型和 Darknet 框架来创建一个路面坑洞检测系统。翻译 2022-08-01 22:34:43 · 5888 阅读 · 1 评论 -
深度好文 | YOLOv5+DeepSORT多目标跟踪深入解读与测试(含源码)
本文主要介绍如何使用Yolo-V5 + DeepSORT实现多目标检测与跟踪。翻译 2022-06-27 21:14:58 · 17532 阅读 · 5 评论 -
深度学习必备 | 3个非常实用的Python图像增强库(使用步骤 + 演示效果)
本文将介绍3个非常实用的Python图像增强库及其使用步骤与效果演示。翻译 2022-06-06 21:58:46 · 6083 阅读 · 2 评论 -
使用Keras和OpenCV实时预测年龄、性别和情绪 (详细步骤+源码)
来源 | https://towardsdatascience.com/real-time-age-gender-and-emotion-prediction-from-webcam-with-keras-and-opencv-bde6220d60a作者 |Sun Weiran翻译| OpenCV与AI深度学习导读 本文将介绍如何使用 Keras 和 OpenCV 从网络摄像头实时预测年龄、性别和情绪。(公众号:OpenCV与AI深度学习)背景介绍 在 Covid...翻译 2022-05-22 16:40:15 · 2124 阅读 · 1 评论 -
基于深度学习的自动车牌识别(详细步骤+源码)
点击下方卡片,关注“ OpenCV与AI深度学习”公众号!视觉/图像重磅干货,第一时间送达!来源 | Learn OpenCV作者 |Sanyam翻译| OpenCV与AI深度学习导读本文将重点介绍 ALPR 的端到端实现。它将侧重于两个过程:车牌检测和检测到的车牌的 OCR。(公众号:OpenCV与AI深度学习)背景介绍 深度学习一直是现代世界发展最快的技术之一。深度学习已经成为我们日常生活的一部分,从语音助手到汽车自动驾驶,它无处不在。其中一项应用是自动车牌识...翻译 2022-03-25 09:06:15 · 21036 阅读 · 0 评论 -
ImportError: cannot import name ‘get_config‘ from ‘tensorflow.python.eager.context‘
在使用下面这个项目时,出现报错https://github.com/zxq2233/n2n-watermark-remove报错完整信息:Traceback (most recent call last): File "train.py", line 5, in <module> from keras.callbacks import LearningRateScheduler, ModelCheckpoint File "D:\Python37\lib\site-p...原创 2021-12-15 16:18:48 · 6128 阅读 · 0 评论 -
基于手势识别的周边应用实例展示与实现教程(含视频教程+源码)
导读本文主要介绍展示基于手势识别的周边应用实例与实现教程(含视频教程+源码)资源。实例来源今天演示的实例均来自下面网站:https://www.computervision.zone/projects/。网站有很多不错的计算机视觉应用而且有教程和源码,基本都是免费的,大家可以自己学习并编码实现。本文挑选了其中基于手势识别的应用实例来做展示,有兴趣的朋友可以在对应的地址去观看学习!实例展示与教程【1】手势识别-手指计数基于手势识别的周边应用实例展示与实现教程..原创 2021-09-14 18:58:20 · 519 阅读 · 0 评论 -
Python手写汉字(中文)识别~单字/多字推荐模式
基于Python, Pyqt5, OpenCV, TensorFlow的手写汉字(中文)识别。效果演示——单字推荐模式:手写汉字(中文)识别演示~单字推荐模式效果演示——多字推荐模式:手写汉字(中文)识别演示~多字推荐模式...原创 2021-04-11 20:14:02 · 2525 阅读 · 10 评论 -
Halcon深度学习标注工具下载与安装步骤介绍
目前Halcon最新版本为20.11,对应的深度学习工具dltool版本为0.4.3,深度学习工具需要单独下载,下载链接:https://www.mvtec.com/downloads/deep-learning-tool离线包下载需要连接外网,如果大家不方便下载可以直接在百度网盘下载,我已经提前上传好了,百度网盘下载地址(或扫描下载):链接:https://pan.baidu.com/s/151c8B1_WXXPRdE3dZKwWnw提取码:q2mi...原创 2021-01-17 14:45:59 · 7133 阅读 · 4 评论 -
Darknet YoloV3/V4中cfg文件参数说明和理解
具体解释可以参考下面这篇文章,写的很不错,这里做备份方便后续查阅。https://blog.csdn.net/phinoo/article/details/83022101原创 2020-06-09 15:01:02 · 2099 阅读 · 0 评论 -
Darknet 训练YoloV3数据集变换扩充与参数配置说明
Darknet 训练YoloV3数据集变换扩充与参数配置说明,具体参考如下链接:https://blog.csdn.net/phinoo/article/details/83022101https://blog.csdn.net/tintinetmilou/article/details/88823821https://blog.csdn.net/qq_35872456/article/details/84216129https://zhuanlan.zhihu.com/p/91587361原创 2020-05-26 19:24:49 · 702 阅读 · 0 评论 -
Yolo v4 Darknet编译(Windows10 + VS2015 + OpenCV4.2)
Darknet github地址:https://github.com/AlexeyAB/darknet最近刚更新了Yolo v4,对比Yolo v3有很大提升,所以迫不及待编译来试试。编译与测试步骤如下:① 下载darknet-master.zip并解压② 打开CMake,设置源码和生成项目路径,设置编译平台比如VS2015 x64, 然后点config,看下官方配置图...原创 2020-04-26 15:31:18 · 4179 阅读 · 5 评论 -
TensorFlow表情识别设计
原创 2020-03-26 19:36:24 · 660 阅读 · 0 评论 -
Windows下使用Darknet Yolo V3训练自己的数据
如何编译Darknet请看上篇博客https://blog.csdn.net/stq054188/article/details/105041555编译好之后,首先用LabelImg标注目标,然后修改配置,训练,整体步骤参考下面2篇文章https://blog.csdn.net/kk123k/article/details/86696540https://blog.csdn.net/d...原创 2020-03-23 14:13:38 · 1947 阅读 · 2 评论 -
Windows10 YOLO V3 Darknet编译测试
主要的编译方法可以参考这篇博客https://blog.csdn.net/KID_yuan/article/details/88380269我的编译环境win10, VS2015, OpenCV3.3,cuda_10.0.130_411.31_win10.exe,cudnn-10.0-windows10-x64-v7.6.4.38跟着上面博客做基本不会出什么大问题,我遇到的问题简单罗列...原创 2020-03-23 09:43:15 · 977 阅读 · 1 评论 -
DeepFashion2服饰数据集下载(附解压密码)
DeepFashion2服饰数据集下载(附解压密码):https://download.csdn.net/download/stq054188/12185469原创 2020-02-23 16:54:32 · 3938 阅读 · 0 评论 -
游戏角色检测跟踪项目实例
效果如下,欢迎相关合作链接:https://pan.baidu.com/s/1nKUBhg-yKY1TD96sWxMe1g提取码:y6ic或点击下方链接查看:https://www.cnblogs.com/stq054188/p/12180835.html...原创 2020-01-11 19:23:35 · 734 阅读 · 1 评论 -
ssd_mobilenet_v1_fpn_coco Error: No variables to save
在使用TensorFlow Object Detection API训练ssd_mobilenet_v1_fpn_coco模型时报错Error: No variables to save下载预训练模型文件对应ssd_mobilenet_v1_fpn_shared_box_predictor_640x640_coco14_sync_2018_07_03config文件ssd_mobi...原创 2020-01-09 16:57:59 · 1077 阅读 · 1 评论 -
TensorFlow如何提高GPU训练效率和利用率
TensorFlow如何提高GPU训练效率和利用率9前言首先,如果你现在已经很熟悉tf.data+estimator了,可以把文章x掉了╮( ̄▽ ̄””)╭但是!如果现在还是在进行session.run(..)的话!尤其是苦恼于GPU显存都塞满了利用率却上不去的童鞋,这篇文章或许可以给你打开新世界的大门噢( ̄∇ ̄)如果发现经过一系列改良后训练效率大大提高了,记得回来给小夕发小红包( ̄...转载 2019-11-10 21:31:17 · 1586 阅读 · 1 评论 -
OpenCV+TensorFlow图片手写数字识别(附源码)
初次接触TensorFlow,而手写数字训练识别是其最基本的入门教程,网上关于训练的教程很多,但是模型的测试大多都是官方提供的一些素材,能不能自己随便写一串数字让机器识别出来呢?纸上得来终觉浅,带着这个疑问昨晚研究了下,利用这篇文章来记录下自己的一些心得!以下这个图片是我随机写的一串数字,我的目标是利用训练好的模型来识别出图片里面的手写数字,开始实战!2层卷积神经网络的训练:...转载 2019-11-10 21:19:07 · 2688 阅读 · 0 评论 -
TensorFlow train error : raise self.ParseError('Expected identifier or number, got %s.' % result)
使用TensorFlow Object Detection API训练时突然遇到这个报错,问题是前面我训练还好好的,查阅了别人类似问题的回答,可能是自己修改了config文件造成哪里缺失或者错误,有可能是编码问题(因为我用的Notepad++),索性把原来能正常训练的config文件复制过来,在此基础上修改,重新训练OK . 报错信息:File "C:\Python35\lib\...原创 2019-11-08 09:43:10 · 1225 阅读 · 0 评论 -
TensorFlow object detection API训练自己的数据集Windows10
一、配置深度学习开发环境(Windows10 GPU)参考链接:https://zhuanlan.zhihu.com/p/40094498我的配置环境如下:1、操作系统:Windows 10 64位2、GPU:NVIDIA GeForce GTX 10503、GPU驱动: 385.544、visual studio community 20155、CUDA 9.06...转载 2019-11-04 22:14:55 · 696 阅读 · 1 评论 -
TensorFlow目标检测API中这些损失(loss)代表含义是什么
TensorFlow目标检测API中这些损失(loss)代表含义是什么?RPN(Region Proposal Network)区域候选网络损失:1.Losses/Loss/RPNLoss/localization_loss:RPN的本地化损失或边界框回归器的损失2.Losses/Loss/RPNLoss/objectness_loss:分类器的损失,分类器是对边界框是感兴趣的...原创 2019-11-04 16:14:47 · 8680 阅读 · 0 评论