自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 CycleGAN和Conditional GAN(cGAN)

例如,在图像生成任务中,通过提供类别标签,可以生成特定类别的图像。在图像到图像的转换任务中,可以通过条件信息控制转换的风格、特征等。训练过程中,生成器的目标是尽可能欺骗判别器,使得生成的图像在视觉上无法与真实图像区分开来。CycleGAN是一种无监督的图像转换模型,它可以在两个不同的图像域之间进行转换,而无需成对的训练数据。例如,它可以将马的图像转换为斑马的图像,或者将夏季景色转换为冬季景色。让我逐步介绍它们的原理和应用。生成器的目标是生成逼真的图像,并使得判别器无法准确区分生成的图像和真实图像。

2023-06-17 18:07:52 427

原创 图像超分算法

3. 基于学习的算法:最近的发展是使用深度学习算法实现图像超分。与其他方法相比,基于学习的算法可以在更复杂的图像中产生更好的结果,但其训练成本更高。图像超分算法旨在将低分辨率(LR)图像转换为高分辨率(HR)图像,例如将480p分辨率的视频转换为1080p分辨率的视频。常见的图像超分算法包括插值法、基于统计的算法和基于学习的算法。2. 基于统计的算法:改进的方法是基于统计的算法,如最小二乘重建和基于学习的映射算法。1. 插值法:最简单的图像超分方法是插值法,它将LR图像中的像素值直接插值到HR图像中。

2023-06-17 07:50:20 341 1

原创 关于对抗生成网络的原理和应用

GAN已经成为了深度学习领域中的一种重要技术,它在提高数据生成效率、增强数据集、自动编码和对抗训练等方面有重大的应用价值。2. 数据增强:GAN可以用生成的样本增强数据集,从而帮助机器学习算法获得更多的数据,提高算法的精度和准确度。3. 生成对抗攻击:GAN可以生成针对人工智能系统的对抗性样本,用于攻击机器学习算法,从而暴露其漏洞和限制。1. 图像生成:GAN可以生成逼真的图像,例如:生成人脸、建筑或汽车等高质量的图像。5. 声音生成:GAN可以生成逼真的声音和音频,例如:人声、背景音乐等。

2023-06-17 07:49:02 345 1

原创 openmmlab mmsegmentation 算法框架介绍

其中,MMSegmentation是OpenMMLab中的一个图像分割框架,它提供了基于PyTorch的深度学习算法以及常用的分割模型和数据集。1. 数据处理:MMSegmentation中封装了几个常用的数据集,包括PASCAL VOC、Cityscapes、ADE20K等数据集,并且提供了数据增强和预处理的工具。总之,MMSegmentation提供了完整的图像分割算法框架,使得用户可以快速开发自己的分割算法,同时也可以用来学习和研究深度学习图像分割领域的相关知识。

2023-06-15 18:28:50 175

原创 YOLO V1 学习摘要

总的来说,YOLO V1算法的核心思想是将目标检测问题看作是一个回归问题,将目标的中心点和宽高等属性直接预测出来。3. 对于每个网格,预测一个包含5+类别数个数的向量,其中5个值分别代表该网格内包含目标的概率、目标的位置(中心点坐标和宽高)以及目标类别的概率。5. 重复以上过程直到所有的网格都被检测完毕,最后用非极大值抑制(NMS)方法过滤掉重复的检测结果,得到最终的目标检测结果。4. 将每个网格的预测向量与之前预定义的锚框(anchor boxes)的尺寸和位置进行匹配,根据匹配程度进行进一步的调整。

2023-06-15 18:26:28 52 1

原创 目标检测 基于IOU的匹配算法

而基于IOU的匹配算法是目标检测中常用的一种算法,其原理是通过计算目标框之间的重叠率(IOU),来确定目标检测算法所预测的目标框和实际目标框之间的匹配关系。3. 重叠率计算:通过计算预测框和真实框之间的重叠率(IOU),确定两者之间的匹配关系。一般的,若两个目标框的IOU大于一定的阈值,则认为它们匹配成功。1. 预测目标框:利用目标检测算法,从给定的图像中预测出若干个目标框,每个目标框包含了目标的位置和尺寸等信息。2. 真实目标框:从数据集中获取目标对应的真实框,包含目标的位置和尺寸等信息。

2023-06-11 17:25:00 867

原创 ROI Pooling和ROI Align 异同点

综上所述,ROI Pooling和ROI Align均是目标检测技术中的特征提取方法,两者的主要区别在于提取特征的方式,ROI Pooling基于max pooling,计算速度快但精度不高,而ROI Align基于双线性插值,精度高但计算量大。ROI Pooling是一种基于max pooling的算法,它将每个ROI划分成相同大小的子区域,并通过在每个子区域中进行max pooling来提取尺度不变的特征。3. 根据子区域的实际位置,在原始图像中进行双线性插值,计算出该子区域的特征。

2023-06-11 17:10:20 153

原创 两阶段目标检测 RPN算法

其中,RPN(Region Proposal Network)是两阶段目标检测中用来生成候选框的关键算法。5. 最后,将候选框送给第二阶段的网络,进一步进行目标检测。通过 RPN 算法生成的候选框,可以显著减少目标检测的计算量,提高准确率和速度。4. 使用非极大值抑制(NMS)筛选高概率的候选框,去掉重复的框,得到最终的候选框。2. 在特征图的每个位置生成多个锚点(Anchor),即不同长宽比和面积的矩形框。3. 对于每个锚点,RPN 输出两个值:其包含目标的概率,以及对应的边界框位置。

2023-06-11 17:02:54 383

原创 mmpretrain介绍

需要先安装OpenMMLab mmpretrain库并下载猫狗图片数据集,然后参照官方文档中的教程进行模型训练、测试和预测。其中,${CONFIG_FILE}和${CHECKPOINT_FILE}是配置文件和模型权重文件的路径,${IMAGE_PATH}是需要预测的图像路径,可以是单张图像或一组图像路径。也可以选择其他的模型。它提供了一个端到端的分类器训练框架,包括数据加载,模型构建,模型训练和评估等功能。从官方网站下载cifar-10数据集,按照mmcls的要求,将数据集划分为训练集和验证集。

2023-06-08 21:51:58 462 1

原创 使用mmpose库 关键点检测

配置文件: 为了使用mmpose库进行关键点检测,需要创建一个配置文件,用于指定数据集路径、模型类型、训练参数等。在配置文件中,需要指定数据集的路径、类别数、输入尺寸、训练参数等。数据准备: 在开始使用mmpose进行关键点检测之前,需要准备适用的数据集。关键点标注通常是人工进行的,可以使用专业工具或者开源标注工具进行标注。训练模型: 使用mmpose库进行模型训练需要执行训练命令,并指定配置文件路径。训练过程中,mmpose库会加载配置文件中指定的模型和数据集,并根据配置文件中的训练参数进行迭代优化。

2023-06-04 18:36:33 505 1

原创 mmsegmentation 2.0 绘制混淆矩阵(二分类)

mmsegmentation 版本从1.0更迭到2.0,绘制混淆的矩阵的py文件还在,但是似乎已经无法使用,很多函数和库发生修改。

2023-05-31 22:19:09 564 4

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除