- 博客(246)
- 资源 (70)
- 收藏
- 关注
原创 扩散模型在图像生成中的应用:从真实样例到逼真图像的奇妙转变
扩散模型是深度学习中一种神奇的模型,它就像是一位魔术师,通过不断添加噪声来让图像变得越来越神奇。生成器G就像一个魔法师,将噪声和输入变成令人惊叹的图像;判别器D则像一个挑剔的观众,对魔术表演进行评判。扩散模型不仅在图像生成方面表现出色,在其他领域也有广泛应用,真是让人大开眼界!
2023-09-16 00:44:32 4694 7
原创 机器故障预测:未来24小时的决胜时刻!!!
预测机器故障是保证生产安全和效率的重要任务。随着人工智能和大数据技术的快速发展,利用这些技术进行机器故障预测已经成为一种趋势。本文将探讨如何利用机器学习算法和实时监控数据来预测未来24小时内可能发生的机器故障,并提出了一种基于深度学习的故障预测模型。该模型能够自动检测和分析各种机器参数和传感器数据,识别出异常模式并预测机器故障的发生。通过实时监测和快速响应,这种故障预测模型能够帮助企业及时发现和解决机器故障,提高生产效率和安全性。
2023-09-14 13:22:17 1091
原创 MemSeg:一种差异和共性来检测图像表面缺陷的半监督方法
本文认为人为创建类内差异和保持类内共性可以帮助模型实现更好的缺陷检测能力,从而更好地区分非正常图像。如图一所示。差异(differences):MemSeg引入人工模拟的异常图像在训练阶段使模型能够区分正常和异常的图像,减轻了半监督学习只能用正常样本进行训练的不足,然后在推理阶段可以直接输入图像无需做任何后处理。共性(commonalities):MemSeg引入了一个记忆池来记录正常样本的通用模式,在训练和推理阶段,比较输入图像和记忆池中的样本之间的差异,为异常区域的定位提供有用的信息。
2023-08-21 23:10:31 3328 7
原创 Pytorch——momentum动量
一、Momentum:(动量,冲量):结合当前梯度与上一次更新信息,用于当前更新;二、Momentum的作用?主要是在训练网络时,最开始会对网络进行权值初始化,但是这个初始化不可能是最合适的;因此可能就会出现损失函数在训练的过程中出现局部最小值的情况,而没有达到全局最优的状态。momentum的出现可以在一定程度上解决这个问题。动量来源于物理学,当momentum越大时,转换为势能的能量就越大,就越有可能摆脱局部凹区域,从而进入全局凹区域。momentum主要是用于权值优化。没引入momen
2020-08-25 11:38:19 19193 5
原创 Pytorch-优化器optimizer
一、优化器:optimizer管理并更新模型中可学习参数的值,使得模型输出更接近真实标签 ;导数:函数在指定坐标轴上的变化率;方向导数:指定方向上的变化率;梯度:一个向量,方向为方向导数,取得最大值的方向;梯度下降法的计算过程就是沿梯度下降的方向求解极小值,也可以沿梯度上升方向求解最大值。参考知乎优化器的讲解,图片也是来自这里!图1.梯度下降法二、优化器基本属性defaults:优化器超参数 state:参数的缓存,如momentum的缓存...
2020-08-24 22:48:32 1803
原创 Pytorch-18种经典的损失函数
一、18种损失函数损失函数:衡量模型输出与真实标签的差异;目标函数 = 代价函数 + 正则化项(L1或者L2等,惩罚项)1、nn.CrossEntropyLoss(交叉熵损失)(1)什么是熵?:熵是信息论中最基本、最核心的一个概念,它衡量了一个概率分布的随机程度,或者说包含的信息量的大小。具体公式推导可以参考这篇博主的讲解:一文搞懂交叉损失,讲解浅显易懂!(2)功能: nn.LogSoftmax ()与nn.NLLLoss ()结合,进行交叉熵计算 nn.C..
2020-08-11 20:14:16 11673
原创 Pytorch-池化、线性、激活函数层
1. 池化层——Pooling layer2. 线性层——Linear layer3. 激活函数层——Activation layer1、池化层——Pooling layer池化运算:对信号进行 “收集”并 “总结”,类似水池收集水资源,因而得名池化层“收集”:多变少 “总结”:最大值/平均值最大值池化:import osimport torchimport randomfrom PIL import Imageimport numpy as npimport
2020-08-07 18:27:21 1336
原创 Pytorch-卷积层及其操作
卷积层1、1d/2d/3d(1)卷积运算:卷积核在输入信号(图像)上滑动,相应位置上进行乘加(2)卷积核:又称为滤波器,过滤器,可认为是某种模式,某种特征。(3)卷积过程类似于用一个模版去图像上寻找与它相似的区域,与卷积核模式越相似,激活值越高,从而实现特征提取。(4)AlexNet卷积核可视化,发现卷积核学习到的是边缘,条纹,色彩这一些细节模式卷积操作:卷积维度:一般情况下,卷积核在几个维度上滑动,就是几维卷积1d卷积2d卷积:https://mlnotebook.github.
2020-08-07 18:09:13 1491 1
原创 nn.Module创建模型
目录:网络模型创建 nn.Module属性1、网络模型创建使用nn.ModuleLeNet网络模型结构:nn.Module总结一个module可以包含多个子module; 一个module相当于一个运算,必须实现forward()函数; 每个module都有8个字典管理它的属性;Pytorch代码实现:import torch.nn as nnimport torch.functional as F# LeNet网络构建class LeNet(nn.
2020-08-06 15:34:44 588
原创 堆排序
一、堆排序堆实际上就是一个完全二叉堆,它分为两个类型:1、最大堆:任意的父节点的值都大于等于它左右孩子节点的值。2、最小堆:任意的父节点的值都小于等于它左右孩子节点的值。二叉堆的根节点叫做堆顶。根据最大堆和最小堆的特点,可以得出最大堆的顶点是整个堆中的最大元素,最小堆中的顶点是整个堆中最小的元素。最大堆满足:parent>= 2*parent+1 (左节点) && parent >= 2*parent+2(右节点)最小堆满足:parent <..
2020-07-31 12:10:26 265
原创 如何快速理解快速排序及C++、python代码实现?
1、快速排序对于给定的一个数列,首先选择一个基准元素;(这个值随意选择!) 将数列中的所有元素和这个基准元素进行比较,大于基准的数就放在基准的右边,小于基准的值就放在左边; 然后将基准值左右两边的子列看作两个新的数列,然后再对新的子数列进行重复上述1,2操作;两种方法:这两种方法都差不多,最低还是要掌握一个方法!1、填坑法:参考:https://www.cnblogs.com/curo0119/p/8588565.html2、指针交换法:参考:https://www.pianshen.co
2020-07-31 10:59:22 240
原创 Pytorch逻辑回归
逻辑回归是线性的二分类模型模型表达式:f(x)指的是Sigmoid函数,也称为Logistic函数;通过阈值0.5将所有值表示为0或者1,代表两个类别线性回归是分析自变量x与因变量y(标量)之间关系的方法 逻辑回归是分析自变量x与因变量y(概率)之间关系的方法 直接来代码:import torchimport torch.nn as nnimport matplotlib.pyplot as pltimport numpy as nptorch.ma.
2020-07-24 15:21:51 520
原创 autograd自动求导-Pytorch
1、torch.autograd.backward功能:自动求取梯度Tensor:用于求导的张量,如:lossretain_graph:保存计算图create_graph:创建导数计算图,创建导数计算图,用于高阶求导grad_tensors:多梯度权重autograd:计算图与梯度求导2、torch.autograd.grad功能:求取梯度• outputs: 用于求导的张量,如 loss• inputs : 需要梯度的张量• create_graph : 创建
2020-07-24 15:02:17 381
原创 Pytorch-计算图和动态图机制
一、计算图和动态图1、计算图计算图是用于描述运算的有向无环图计算图的两个重要元素:结点(node)和边(edge)结点表示数据:如向量、矩阵、张量边表示运算:一些数学操作2、叶子结点叶子结点:用户创建的结点称为叶子结点,如x,wtorch.tensor.is_leaf:用来查看是否为叶子结点叶子结点的用处:在反向传播之后,只有叶子结点的梯度会被保留,其他中间结点的梯度数据会被释放,以节省内存若要保存某特定结点的梯度,可以在运行反向传播函数前,补上一句tensor.retain_grad(
2020-07-23 17:52:54 521
原创 Pytorch-张量创建与线性回归
1、张量创建import torch# 设置返回随机种子的数量int型a = torch.manual_seed(1)print(a)help(torch.manual_seed)<torch._C.Generator object at 0x0000025223508DB0>Help on function manual_seed in module torch.random:manual_seed(seed) Sets the seed for generatin
2020-07-23 17:47:37 309
原创 第一章:张量的简介与创建
文章目录1、张量:就是一个多为数组(三维的)2、张量的创建2.1 直接创建张量2.2 依据数值创建2.3 依据概率创建1、张量:就是一个多为数组(三维的)一维的就是一个标量二维的就是一个数组Variable是torch.autograd中的数据类型主要用于封装Tensor,进行自动求导;data:被包装的Tensor;grad:data的梯度;grad_fn:创建Tensor的function,是自动求导的关键;用于对记录对数据使用了什么操作;requires_grad:指示是否需要梯度;
2020-07-19 08:53:49 409
原创 End-to-End Learning of Deep Visual Representations for Image Retrieval
1、主要贡献:1、利用一个大规模并且嘈杂的地标数据集,然后开发一种自动清理方法,产生一个适合深度检索的训练集;2、我们建立在最近的R-MAC区域最大激活描述符(这个是在MAC的基础上提出的局部区域方法)描述符的基础上,说明它可以被解释为一个深度和可微的体系结构,并提出了改进来增强它;3、我们用Simaese体系结构来训练这个网络,然后用一个triplet loss整合三个流;R-MAC区域最大激活描述符:该方法计算了不同尺度下的多个图像区域的基于CNN的描述子,这些描述子被汇总成...
2020-07-15 20:04:34 1356
原创 AttributeError:ImageDataGenerator object has no attribute flow_from_dataframe
from keras_preprocessing.image import ImageDataGeneratorvalidation_generator = valid_datagen.flow_from_dataframe(val_data, directory='./tiny-imagenet-200/val/images/', x_col='Files',y_col='Class',ta.
2020-06-28 20:10:54 3270 1
翻译 DenseNet Models for Tiny ImageNet Classification(翻译+代码)
PS:个人学习记录;有问题请留言,看到会回复!谢谢!原文地址:https://arxiv.org/pdf/1904.10429摘要:本文提出了两种基于微型ImageNet数据集的图像分类模型。我们基于密接卷积网络的思想从无到有地建立了两个截然不同的网络。根据该数据集的图像分辨率,通过计算卷积层的接收场,设计了网络结构。我们还使用了一些与图像增强和循环学习率相关的非常规技术来提高模型的准确性。该网络在高约束和低计算资源下训练。我们的目标是达到60%的前1验证精度,并给出了结果和误差分析。1. 引.
2020-06-28 12:00:55 1862 1
原创 可视化一张图像的卷积神经网络的激活区域
可视化卷积神经网络的激活区域将图像的激活区域与原始图像进行比较,检查激活区域并发现网络学习的特征,发现较浅层中的通道学习颜色和边缘等简单特征,较深层中的通道学习复杂特征。下面都是基于matlab R2018b实现。1、加载预训练的网络和图像加载网络;我这里选择简单的alexnetnet = alexnet;% 读取图像im = imread('hehe.jpg');% 查看网络结构net.Layersalexnet的网络结构信息如下:ans = 25x1 Layer
2020-05-15 11:06:26 1141
原创 C++ Primer Plus (第六版)源代码
1、C++ primer source code链接:https://pan.baidu.com/s/108MKrf-miy4beBvg8lMpIQ&shfl=sharepset提取码:vxg22、C++相关中文电子书链接:https://pan.baidu.com/s/1mE5MzG7EVwSryAp-EiG2hA&shfl=sharepset提取码:yr6...
2019-10-22 15:51:40 4992 16
原创 C++ Primer Plus (第6版) 第5章课后编程题
1、输出区间的数之和#include <iostream>using std::cout;using std::endl;using std::cin;intmain (void) { int nLowerBound, nUpperBound; cout << "输入区间:"; cin >> nLowerBound >...
2019-10-22 14:46:28 347
原创 C++ Primer Plus(第六版) 第4章 课后编程题
1、输出下列的信息;名字包含多个字母;程序中将下调整成绩,向上调整一个字母What is your first name? Betty Sue What is your last name? Yewe What letter grade do you deserve? B What is your age? 22 Name: Yewe, Betty Sue Gra...
2019-10-20 10:13:02 429
原创 如何使用VGG16提取某层的特征?
1、VGG16网络结构图VGG16结构为:卷积层 + 全连接层=13 + 3 = 161、卷积层:由上图可知分为5个部分共13层,即conv1~conv52、三个全连接层,即fc6、fc7、fc8这个VGG16网络就是基于ImageNet数据集来的;它的数据集的类数为1000类;对应fc8层的输出1000fc6和fc7的输出维数都为4096;因此如果要训练自己的数据集;fc8层的...
2019-10-13 22:38:30 10824 9
原创 Tkinter 编程入门
Tkinter 编程1、Tkinter 是内置到 python 的安装包中、只要安装好 Python 之后就能 import Tkinter 库;基本的GUi都可以实现,但是如果你是要实现专业的;如果真的需要使用Python开发GUI应用,wxPython、PyQt、PyGTK等模块都是不错的选择。2、Tkinter的提供各种控件,如按钮,标签和文本框;这些控件通常被称为控件或者部件。如...
2019-10-13 10:33:48 529
原创 水仙花数、正整数的反转、百钱百鸡问题、花旗骰游戏、斐波那契数列、10000以内的完美数、100以内的所有素数
针对:变量、类型、运算符、表达式、分支结构、循环结构 的练习ps:练习内容来源于Github:python-100-Day1水仙花数 正整数的反转 百钱百鸡问题 花旗骰游戏 斐波那契数列 10000以内的完美数 100以内的所有素数1、水仙花数 水仙花数也被称为超完全数字不变数、自恋数、自幂数、阿姆斯特朗数,它是一个3位数,该数字每个位上数字的立方之和正好等...
2019-09-28 17:18:46 1456 1
翻译 C++ 结构体定义和使用
将结构体的声明放在main()函数中,紧跟在开始括号的后面,内部声明只能被该声明所属的函数使用,通常应使用外部声明,便于所有函数都可以使用这种类型的结构;同时可以使用赋值运算符(=)将结构体赋给另一个同类型的结构体(结构体中的每个成员都设置为另一个结构体中相应成员的值,称为成员赋值)结构数组:元素为结构的数组 (结果被括在花括号中、用逗号分割的值列表,其中每个值本身又是一个被括在花括号中、用逗号分割的值列表)将结构体的声明放在main()的前面,外部声明可以被后面任何函数使用。创建struct结构。
2019-08-01 16:41:06 12481 5
原创 EOFError: Compressed file ended before the end-of-stream marker was reached
出现这种问题不要慌!在stackoverflow上看到的解释:This is because for some reason you have an incomplete download for the MNIST dataset因为MNIST数据集是运行时下载的,很可能是在下载MNIST数据时,由于网络问题, 下载不全。我们可以到自己的datasets文件夹下找到未下载完全的数据集,然...
2019-04-14 10:15:58 20840 16
原创 [keras]如何解决MNIST 数据集下载不了的问题
keras 源码中下载MNIST的方式是 path = get_file(path, origin='https://s3.amazonaws.com/img-datasets/mnist.npz'),数据源是通过 url = https://s3.amazonaws.com/img-datasets/mnist.npz 进行下载的。但是在最近的学习过程中,如果直接从官网的链接下载的话会非常的慢,...
2019-04-11 17:37:14 5389 8
原创 matlab--GUI 如何实现打开图片
在命令行窗口输入guide会自动弹出GUI的初始化状态,选择自己默认的状态,其他的也可以!然后简单绘制一个座标轴用于显示你要的图片!我的简单的GUI如下!当你编辑好界面后,在对应的.m文件里你会看到一堆函数,一开始做学习做简单界面的功能的时候,并不需要理会这些函数究竟写了什么,只需要明白你实现的控件对应的回调函数,也就是Callback函数,实现的功能代码写进函数里就行。而CreateFc...
2019-04-09 10:35:02 21048 5
原创 微信机器人
首先登陆图灵机器人注册一个属于自己的微信机器人,注册成功后可查看apikey以供后面使用!我是在pycharm中使用的,导入相应的模块即可!下面直接看代码吧!代码很简洁!# 源代码如下:# wechat autoreplyimport itchatimport requestsimport re# 抓取网页def getHtmlText(url): try: ...
2019-04-08 09:40:08 3144
原创 如何可视化卷积神经网络特征(基于matlab R2018b)
下面我就简单的说一下,也便于理解!一、先加载预先训练好的网络模型(这里呢,先以Alexnet为例,其他网络模型的应用方法都是一样的!)net = alexnet; 在matlab命令行窗口输入,如果你之前没有加载过Alexnet,也不用担心,matlab还是很人性化的,按上面的指令进行添加即可!接下来呢,我们可以看一下Alexnet的整体框架,在matlab中都是封装好的,可以借助一些...
2019-03-14 11:41:31 8551 27
原创 基于vgg16的图像检索系统(首先要先熟悉VGG16模型)
主要的流程如下:1. 首先要熟悉vgg16模型;(推荐这位博主的文章介绍,讲的比较清楚!)2. 其次就是熟悉图像检索的流程;(基于内容的图像检索技术综述-CNN 方法)以上就是我制作这个系统的全部过程;还有就是可以看一下相关的论文去学习图像检索方面的知识还有就是可以看一下相关的论文去学习图像检索方面的知识。本人是个刚接触matlab的小白,所以两种方式都采用了。第一步:首先我是看了网上其他...
2019-03-06 20:13:52 8487 10
原创 matlab深度学习——【卷积神经网络】手写字的识别
这里主要是基于卷积神经网络的手写字的识别,我是用matlab做的,如果有对卷积神经网络不太熟悉的伙伴可以搜下,网上资源比较多,我这里就不多说了,直接上代码了。%%准备工作空间clcclear allclose all%%导入数据digitDatasetPath = fullfile(’./’,’/HandWrittenDataset/’);imds = imageDatastor...
2019-03-04 21:16:39 19212 160
原创 EfficientNet大解析:如何重新定义模型效能?
提出了一种新的尺度缩放方法,使用简单而有效的复合系数均匀地调整深度/宽度/分辨率的所有维度(Compound Model Scaling复合模型缩放)。并在MobileNets和ResNet上验证了有效性。采用一组固定的比例系数均匀缩放网络的width、depth和resolution。使用神经架构搜索来设计一个新的baseline,并扩展了一系列模型,称为EfficientNets。
2024-06-23 23:39:12 919
原创 探索AI前沿:本地部署GPT-4o,打造专属智能助手!
这通常表明客户端无法建立与服务器的连接,可能是由于网络问题、服务器宕机、API 密钥无效或过期等原因造成的。图中是一本讲解编程或计算机科学相关内容的书籍的某个页面。按照----->设置----->网络和Internet----->代理----->打开代理即可。代理设置:如果你使用代理连接到互联网,确保你的代理设置正确配置,并且代理服务器运行正常。- 提到了传统C++中的NULL以及其在现代C++中的替代 `nullptr`。有了第一步的API_key,就可以直接调用GPT-4o,不说废话,直接上代码。
2024-06-22 00:44:34 1545
原创 图像去重技术:MD5哈希在自动化中的应用
MD5(Message Digest Algorithm 5)是一种广泛使用的哈希函数,它可以产生一个128位(16字节)的哈希值,通常用一个32位的十六进制字符串表示。如果两张图像的内容完全相同,那么它们经过MD5哈希处理后得到的哈希值也会是相同的。MD5哈希函数的主要特点是它将任意长度的数据转换成一个固定长度的哈希值,并且理论上,不同的输入数据产生相同哈希值的概率非常低(尽管不是完全不可能)。因此,MD5常被用于验证文件的完整性,比如确保文件在传输过程中没有被篡改。
2024-06-15 15:23:37 988
原创 YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information
深度学习的研究都试图精确地找到输入任务和目标任务之间的映射。然而,过去的大多数方法都忽略了输入数据在前馈过程中可能有不可忽视的信息损失量。这种信息的丢失可能导致有偏差的梯度流,随后用于更新模型。上述问题会导致深度网络在目标和输入之间建立不正确的联系,导致训练后的模型产生不正确的预测。在深度网络中,前馈过程中输入数据丢失信息的现象通常被称为信息瓶颈,其原理图如下图所示。
2024-03-28 21:54:25 977
原创 YOLOv9 实战指南:打造个性化视觉识别利器,从零开始训练你的专属测试集
今天的深度学习方法侧重于如何设计最合适的目标函数,从而使模型的预测结果能够最接近真实标签。同时,设计一个合适的体系结构,可以获取足够的信息进行预测。现有的方法忽略了输入数据在进行分层特征提取和空间转换时,会丢失大量信息。本文研究数据通过深度网络传输时数据丢失的重要问题,即信息瓶颈和可逆函数。并且提出了可编程梯度信息(PGI)的概念,以应对深度网络实现多个目标所需的各种变化。PGI可以为目标任务提供完整的输入信息来计算目标函数,从而获得可靠的梯度信息来更新网络权值。
2024-03-28 21:49:02 1634
Class-Weighted Convolutional Features for Visual Instance Search.pdf
2020-12-10
tensorflow-2.3.1-cp37-cp37m-win_amd64.whl
2020-12-10
Unsupervised Part-based Weighting Aggregation
2020-12-10
tutorials.zip
2020-12-08
手写数字识别数据集(基于matlab实现)
2020-10-28
Corel1K.zip
2020-08-03
Image Retrieval via Decoupling Diffusion into Online and Offline Processing
2019-08-29
Image Retrieval using CNN and Low-level Feature Fusion
2019-07-01
Unsupervised Deep Transfer Feature Learning for Medical Image Classification
2019-07-01
Zhang_Cross-Scene_Crowd_Counting_2015_CVPR_paper.pdf
2019-05-23
A NOTE ON THE EVALUATION OF GENERATIVE MODELS.pdf
2019-05-23
机器故障预测这个竞赛的焦点是预测机器是否会在未来24小时内故障 数据包括与机器性能相关的各种特征,例如温度、振动
2023-12-19
YOLOv7格式的EDS数据集,直接放在yolov7的目录下即可训练
2022-08-06
基于tensorflow2.4.0版本的transformer computer vision 训练数据集是cifar10
2022-03-13
使用windows中的fonts解决ubuntu中的乱码情况
2021-12-28
Joint Feature and Labeling Function Adaptation for Unsupervised Domain Adaptation.pdf
2021-09-28
浅析软件工程对人工智能的影响.pdf
2021-04-06
CNN-Prediction-Based-Reversible-Data-Hiding-main (1).zip
2021-04-06
Aggregating Deep Convolutional Features for Image Retrieval.pdf
2021-03-09
Fast object retrieval using direct spatial matching.pdf
2020-12-25
Deep Image Retrieval:Learning global representations for image search
2020-12-25
Google Landmarks Dataset v2 A Large-Scale Benchmark for Instance-Level Recogniti
2020-12-24
Large-Scale Image Retrieval with Attentive Deep Local Features
2020-12-24
基于角点的动态加权多特征融合图像检索方法.pdf
2020-12-24
particular object retrieval with integral max-pooling of cnn activations.pdf
2020-12-17
A_Baseline_for_Visual_Instance_Retrieval_with_Deep.pdf
2020-12-17
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人