自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

人工智能视觉分析算法学习实践和经验分享。

python、pytorch,目标检测,分类识别,关键点检测

  • 博客(126)
  • 资源 (4)
  • 收藏
  • 关注

原创 人工智能算法工程师成长曲线

机器视觉算法工程师成长之路学习导图(后续将持续更新)模块一:图像基础常用的图形文件存储格式源始图像数据:raw image模块二:工具IDE和环境模块三:语言工具和库模块四:人工智能--神经网络算法模块五:参考文献学习导图(后续将持续更新)Mon 02Mon 09Mon 16Mon 23Mon 30Mon 06Mon 13Mon 20Mon 27Mon 03Mon 10Mon 17图像基础 ...

2020-03-26 12:01:50 708

原创 Mindspore框架循环神经网络RNN模型实现情感分类|(二)RNN模型构建

RNN单个Cell的结构简单,为RNN的链式连接平铺,因此也造成了梯度消失(Gradient Vanishing)问题,具体表现为RNN网络在序列较长时,在序列尾部已经基本丢失了序列首部的信息。为了克服这一问题,LSTM(Long short-term memory)被提出,通过门控机制(Gating Mechanism)来控制信息流在每个循环步中的留存和丢弃。

2024-07-22 09:26:56 375

原创 昇思25天学习打卡营第21天|RNN实现情感分类

Mindspore框架循环神经网络RNN模型实现情感分类|(一)数据集准备Mindspore框架循环神经网络RNN模型实现情感分类|(二)RNN模型Mindspore框架循环神经网络RNN模型实现情感分类|(三)模型训练与推理tips:安装依赖库。

2024-07-21 16:11:42 452

原创 昇思25天学习打卡营第20天|Diffusion扩散模型

Fashion_MNIST数据集加载。

2024-07-20 17:14:02 257

原创 昇思25天学习打卡营第18天|Pix2Pix实现图像转换

人工智能mindspore框架下Pix2Pix模型实现真实图到线稿图的转换

2024-07-19 18:57:11 142

转载 昇思25天学习打卡营第17天|GAN图像生成

MNIST手写数字数据集是NIST数据集的子集,共有70000张手写数字图片,包含60000张训练样本和10000张测试样本,数字图片为二进制文件,图片大小为28*28,单通道。图片已经预先进行了尺寸归一化和中心化处理。本案例将使用MNIST手写数字数据集来训练一个生成式对抗网络,使用该网络模拟生成手写数字图片。

2024-07-18 22:23:21 12

原创 AttributeError: module ‘PyInstaller.compat‘ has no attribute ‘is_py312‘

打包时发生错误:AttributeError: module ‘PyInstaller.compat’ has no attribute ‘is_py312’1.报错可能是由于环境中安装了过时的 IPython 引起的。我们可以尝试将其更新到更新的版本。一个关于tkinter界面,加载AI分析模型,分析图片展示结果的窗口。3.虽然打包正常,但得到的可执行文件提示缺函数。这时我们需要编写spec文件来添加依赖和资源。更新后,可正确打包。

2024-07-18 10:32:36 663

原创 昇思25天学习打卡营第16天|CycleGAN图像风格迁移

CycleGAN图像风格迁移推理实现。

2024-07-17 17:07:08 320

原创 Mindspore框架CycleGAN模型实现图像风格迁移|(四)CycleGAN模型训练

CycleGAN模型在训练中,有4个反向传播,分别为G(x)、Dx、F(y)、Dy四个网络的反向传播。表示真假苹果损失,真假橘子损失,周期一致损失的综合损失函数。

2024-07-17 16:26:41 427

原创 Mindspore框架CycleGAN模型实现图像风格迁移|(三)损失函数计算

cycleGAN生成网络优化器和损失函数简介。

2024-07-16 22:26:54 404

原创 Mindspore框架CycleGAN模型实现图像风格迁移|(二)实例数据集(苹果2橘子)

图片来源于ImageNet,该数据集共有17个数据包,本文只使用了其中的苹果橘子部分。图像被统一缩放为256×256像素大小,其中用于训练的苹果图片996张、橘子图片1020张,用于测试的苹果图片266张、橘子图片248张。

2024-07-15 18:01:14 241

原创 Mindspore框架CycleGAN模型实现图像风格迁移|(一)Cycle神经网络模型构建

CycleGAN 网络本质上是由两个镜像对称的 GAN 网络组成。包括两个生成器G、F,两个判别器Dx,Dy。

2024-07-15 17:53:10 246

原创 昇思25天学习打卡营第15天|基于MobileNetv2的垃圾分类

MobileNet专注于的轻量级CNN网络。MobileNet网络使用深度)的思想在准确率小幅度降低的前提下,大大减小了模型参数与运算量。并引入宽度系数α和分辨率系数β使模型满足不同应用场景的需求。因为MobileNet网络中Relu激活函数处理低维特征信息时会存在大量的丢失,所以MobileNetV2网络提出使用倒残差结构(Inverted residual block)和Linear Bottlenecks来设计网络,以提高模型的准确率,且优化后的模型更小。

2024-07-14 15:19:49 433

原创 昇思25天学习打卡营第14天|K近邻算法实现红酒聚类

类别(13类属性):Alcohol,酒精;Malic acid,苹果酸Ash,灰;Alcalinity of ash,灰的碱度;Magnesium,镁;Total phenols,总酚;Flavanoids,类黄酮;Nonflavanoid phenols,非黄酮酚;Proanthocyanins,原花青素;Color intensity,色彩强度;Hue,色调;OD280/OD315 of diluted wines,稀释酒的OD280/OD315;Proline,脯氨酸。。

2024-07-12 18:54:47 719

原创 昇思25天学习打卡营第13天|基于MindNLP+MusicGen生成自己的个性化音乐

MindNLP是一个依赖昇思MindSpore向上生长的NLP(自然语言处理)框架,旨在利用MindSpore的优势特性,如函数式融合编程、动态图功能、数据处理引擎等,致力于提供高效、易用的NLP解决方案。通过全面拥抱等开源社区,实现模型的快速迁移和适配,同时保持对MindSpore特性的深度利用。MindNLP适用于各种NLP任务,包括但不限于文本分类、情感分析、信息抽取、问答系统等。位于GitHub上(MindNLP GitHub仓库),用户可以在此获取MindNLP的源代码、文档和示例代码。

2024-07-12 09:03:43 1001

原创 昇思25天学习打卡营第12天|Vision Transformer图像分类

ViT则是自然语言处理和计算机视觉两个领域的融合结晶。在不依赖卷积操作的情况下,依然可以在图像分类任务上达到很好的效果。

2024-07-10 18:53:11 553

原创 昇思25天学习打卡营第11天|SSD目标检测

SSD采用VGG16作为基础模型,然后在VGG16的基础上新增了卷积层来获得更多的特征图,利用了多尺度的特征图做检测。SSD先通过卷积不断进行特征提取,在需要检测物体的网络,直接通过一个3 ×3卷积得到输出,卷积的通道数由anchor数量和类别数量决定,具体为`(anchor数量*(类别数量+4))`。

2024-07-09 23:03:41 354

原创 图像类别生成数字标签

COCO 2017数据集分类标签。生成对应顺序数字标签方法。

2024-07-09 22:34:53 194

原创 昇思25天学习打卡营第10天|ShuffleNet图像分类

ShuffleNet是一种专为移动设备设计的、计算效率极高的卷积神经网络(CNN)架构。其网络结构的设计主要围绕减少计算复杂度和提高模型效率展开,通过引入逐点分组卷积(Pointwise Group Convolution)和通道洗牌(Channel Shuffle)两种新技术,实现了在保持精度的同时大幅降低计算成本。

2024-07-08 21:59:08 651

原创 昇思25天学习打卡营第9天|ResNet50图像分类

残差结构由两个分支构成:一个主分支𝐹(𝑥),一个shortcuts(图中弧线表示,𝑥𝐹(𝑥)+𝑥。通过Relu激活函数后即为残差网络最后的输出。定义类实现结构定义类实现Bottleneck结构在输入相同的情况下Bottleneck结构相对结构的,更适合层数较深的网络,ResNet50使用的残差结构就是Bottleneck。该结构的主分支有三层卷积结构,分别为1×1的卷积层、3×3卷积层和1×1的卷积层,其中1×1的卷积层分别起降维和升维的作用。

2024-07-07 17:58:49 879

原创 pandas读取CSV格式文件生成数据发生器iteration

在Pandas中,可以使用pandas.read_csv函数读取CSV文件,并使用iter函数将DataFrame转换为迭代器,每次next时返回一行数据。

2024-07-06 11:10:41 243

原创 昇思25天学习打卡营第8天|ResNet50迁移学习

迁移学习是一种机器学习方法,具体是指将已经在某一领域(或任务)学习到的知识或模型,应用到另一个不同但相关的领域(或任务)中,以提高在该新任务上的学习效率和效果。这种知识或模型的迁移可以包括网络参数、特征表示、数据间的关系等多种形式的知识。

2024-07-05 22:21:19 384

原创 昇思25天学习打卡营第7天|保存与加载

MindSpore是由华为开源的全场景深度学习框架,旨在帮助用户更高效地开发AI应用。在MindSpore中,网络模型的构建主要通过继承mindspore.nn.Cell类来实现。本文介绍了网络模型的保存、加载和导出方法。

2024-07-04 18:04:49 211

原创 昇思25天学习打卡营第6天|数据变换 Transforms

通用数据增强mindspore.dataset.transforms接口常用变换概览。

2024-07-03 22:23:22 908

原创 昇思25天学习打卡营第5天|FCN图像语义分割

全卷积网络(FCN)是用于图像语义分割的一种框架。语义在图像领域指的是图像的内容,对图片意思的理解。因FCN丢弃全连接层替换为全卷积层,网络所有层均为卷积层,故称为全卷积网络。FCN是首个端到端(end to end)进行像素级)预测的全卷积网络。语义分割的目的是对图像中每个像素点进行分类。与普通的分类任务只输出某个类别不同,语义分割任务输出与输入大小相同的图像,输出图像的每个像素对应了输入图像每个像素的类别。可视化输出结果,不同类别用颜色表示。卷积化:使用VGG-16作为FCN的backbone。

2024-07-01 22:37:36 300

原创 昇思25天学习打卡营第4天|函数式自动微分

关于导数,偏导数,方向导数,微分,和梯度与深度学习模型优化的深度联系。导数本质是一种极限,实际场景中表示切线斜率;微分本质是“以直代曲,线性逼近”,让本来对曲线进行运算的操作,转化成对直线进行操作,简化了难度。

2024-06-30 16:54:34 1023

原创 昇思25天学习打卡营第3天|网络构建

在MindSpore中,Cell类是构建所有网络的基类,也是网络的基本单元。cell:神经细胞,神经元。本文介绍了mindspore.nn网络模型构建关键接口。

2024-06-29 14:07:30 329

原创 昇思25天学习打卡营第2天|数据集Dataset

mindspore.dataset模块提供了加载和处理各种通用数据集的API,如MNIST、CIFAR-10、CIFAR-100、VOC、COCO、ImageNet、CelebA、CLUE等, 也支持加载业界标准格式的数据集,包括MindRecord、TFRecord、Manifest等。此外,用户还可以使用此模块定义和加载自己的数据集。

2024-06-28 23:56:17 358

原创 昇思25天学习打卡营第1天|快速入门-Mnist手写数字识别

Mindspore框架入门学习,完成一个完整的手写数字识别项目。

2024-06-27 11:04:52 403

原创 Corrupt JPEG data: 2 extraneous bytes before marker 0xd9

Corrupt JPEG data: 2 extraneous bytes before marker 0xd9警告产生的主要原因和解决办法,ps工具修复和python修复方法。

2024-06-18 16:09:53 1275

原创 Python中class的用法

类是面向对象编程(Object-Oriented Programming, OOP)的核心概念之一,它允许我们定义具有属性和方法的对象类型。

2024-05-21 11:39:09 2087 1

原创 python中特殊的静态方法__new__

设计模式主要用于解决在软件设计和开发中经常遇到的特定问题,它们提供了一种可重用的解决方案,使得代码更加健壮、可维护和可扩展。

2024-05-21 11:14:46 830

原创 python函数详解

1. 函数定义,调用;参数,可变参数,关键字参数解析。2. 函数的高阶应用:递归,高阶函数,闭包,装饰器。3. 装饰器函数在Python中非常有用,特别是在需要为多个函数添加相同功能时。通过使用装饰器,我们可以避免重复编写相同的代码,并使得代码更加模块化和可维护。4. 匿名函数短小精悍,非常好用。但它们并不适合定义复杂的函数或包含多个语句的函数。对于更复杂的逻辑,通常应该使用常规的def语句来定义函数。

2024-05-16 15:33:01 1003

原创 ModuleNotFoundError: No module named ‘openpyxl‘的解决方案

ModuleNotFoundError: No module named ‘openpyxl’ 这个错误表示你的 Python 环境中没有安装 openpyxl 这个模块。openpyxl 是一个用于读写 Excel 2010 xlsx/xlsm/xltx/xltm 文件的 Python 库。

2024-05-15 18:08:49 4318 2

原创 python文件操作常用方法(读写txt、xlsx、CSV、和json文件)

1.文本对open()函数,seek()函数, tell() 函数,flush()函数等文件操作函数做了简单的介绍,和实例应用。2.使用文件工具,pandas,csv,json等操作txt,cvs,excel,json文件。

2024-05-15 17:36:37 1263

原创 Python字符串操作方法详解

python字符串内置方法。如比较、表示、属性访问。

2024-05-14 13:00:58 275

原创 YOLOv8分类识别训练配置详细

注意,此处数据与分割,检测,关键点算法的数据输入yaml不同.data=数据集文件夹地址imageFER(根据自己存放地址而变)注意:# 加载预训练模型方法导入分类模型参数,可能因为自行下载的YOLOv8-cls.pt预训练模型文件有问题,会报bug。根据损失函数,精确度曲线,调整参数或新增数据均衡类别。每一个数字标签文件夹里面是面部表情图片。,建议使用在线下载最新模型。3.掌握训练结果分析。

2024-04-09 18:03:42 1134 9

原创 ModuleNotFoundError: No module named ‘ultralytics.utils‘

ModuleNotFoundError: No module named 'ultralytics.utils'原因分析与问题解决。

2024-04-09 17:05:29 1730

原创 json.decoder.JSONDecodeError: Extra data: line 1 column 332 (char 331)

采用open函数读写模式修改json文件字段。

2023-11-30 11:44:20 581

原创 yolov8-pose姿势估计,站立识别

姿势估计是一项涉及识别图像中特定点(通常称为关键点)位置的任务。姿态估计模型的输出是表示图像中对象上的关键点的一组点,通常连同每个点的置信度分数。当您需要识别场景中对象的特定部分以及它们彼此之间的位置时,选择姿势估计。本文,利用关键点位置余弦函数,识别出站立动作。

2023-11-27 22:27:46 2246

cycleGAN风格迁移数据集.rar

资源1:CycleGAN_apple2orange。苹果<=>橘子风格互换数据集。 资源2:monet2photo:训练集中的 A文件夹为1072张莫奈风格油画;训练集中的B文件夹为6287张现实风景照;测试集中的A 文件夹为121张莫奈风格油画;测试集中的B文件夹为751张现实风景照。 Mindspore框架CycleGAN模型实现图像风格迁移算法实现:(https://blog.csdn.net/beauthy/article/details/140443871?spm=1001.2014.3001.5501)

2024-07-17

MobileNetv2-26类垃圾分类模型

class_cn = ['贝壳', '打火机', '旧镜子', '扫把', '陶瓷碗', '牙刷', '一次性筷子', '脏污衣服', '报纸', '玻璃制品', '篮球', '塑料瓶', '硬纸板', '玻璃瓶', '金属制品', '帽子', '易拉罐', '纸张', '菜叶', '橙皮', '蛋壳', '香蕉皮', '电池', '药片胶囊', '荧光灯', '油漆桶']

2024-07-14

MobileNetv2预训练模型 做图像分类

加载ImageNet数据上预训练的MobileNetv2。

2024-07-13

人工智能视觉分析+人员伏案睡岗检测接口+训练好的模型资源

目标人员检测,人员行为分类,睡岗检测。数据类别:{0: 'BendingDown', 1: 'Lying', 2: 'OtherSitting', 3: 'Sitting', 4: 'SleepOnDesk', 5: 'SquattingDown',6: 'Standing'}弯腰,躺,复杂坐姿,标准坐姿,伏案睡姿,蹲,站立。资源包括模型调用接口,和训练好的模型资源(pt格式和onnx格式)。

2024-07-10

pandas读取CSV格式文件生成数据发生器iteration

骨龄数据集boneage-training-dataset.csv

2024-07-06

ResNet50迁移学习

Resnet50网络预训练模型。

2024-07-05

FER,Facial expression recognition表情识别算法模型

制作一个表情分类数据集,用yolov8m-cls训练的分类模型。

2024-04-09

yolov8-pose姿势估计,站立识别:动作检测-站姿-接口函数

基于yolov8-pose的姿势估计模式,实现站姿动作识别python接口和关键点pose模型。详细实现步骤参见博客-yolov8-pose姿势估计,站立识别。https://blog.csdn.net/beauthy/article/details/134651110?spm=1001.2014.3001.5501

2023-11-27

轮廓边缘预测模型u2net.pth

项目U2-net.pth的目的是把服装裤子的轮廓边缘预测出来。 1. 数据集包括:服装裤子和裤子轮廓图作为标签 2. 构建模型:U2-net 3. 实现:数据准备+训练代码+测试代码+评估和展示 项目详细数据和代码参见本blog:https://blog.csdn.net/beauthy/article/details/121076548?spm=1001.2014.3001.5501

2021-11-01

checkpoints.zip

本资源对应Blog:虚拟试穿 without parsing (https://blog.csdn.net/beauthy/article/details/118147977)的模型应用资源。测试用模型有两个:gen_model_final.pth,warp_model_final.pth。即为本资源提供的模型数据。需要测试数据集可以在资源或blog下留言。

2021-06-23

checkpoints.rar

本资源对应Blog:虚拟试穿测试详细讲解(https://blog.csdn.net/beauthy/article/details/113698320)的模型资源,整个网络由G1+G2+Unet+G3构成。训练保存的网络模型有:latest_net_U.pth,latest_net_G1.pth,latest_net_G2.pth,latest_net_G.pth。即为本资源提供的模型数据。需要测试数据集可以在资源或blog下留言。

2021-06-16

KPDEM_model.zip

KPDEM_model.zip包括用关键点模型算法(Keypoints Detection)训练服装数据后,得到的裤子、短裙、外套,大衣,dress的关键点检测模型。

2021-04-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除