- 博客(238)
- 资源 (70)
- 收藏
- 关注

原创 扩散模型在图像生成中的应用:从真实样例到逼真图像的奇妙转变
扩散模型是深度学习中一种神奇的模型,它就像是一位魔术师,通过不断添加噪声来让图像变得越来越神奇。生成器G就像一个魔法师,将噪声和输入变成令人惊叹的图像;判别器D则像一个挑剔的观众,对魔术表演进行评判。扩散模型不仅在图像生成方面表现出色,在其他领域也有广泛应用,真是让人大开眼界!
2023-09-16 00:44:32
1764
2

原创 MemSeg:一种差异和共性来检测图像表面缺陷的半监督方法
本文认为人为创建类内差异和保持类内共性可以帮助模型实现更好的缺陷检测能力,从而更好地区分非正常图像。如图一所示。差异(differences):MemSeg引入人工模拟的异常图像在训练阶段使模型能够区分正常和异常的图像,减轻了半监督学习只能用正常样本进行训练的不足,然后在推理阶段可以直接输入图像无需做任何后处理。共性(commonalities):MemSeg引入了一个记忆池来记录正常样本的通用模式,在训练和推理阶段,比较输入图像和记忆池中的样本之间的差异,为异常区域的定位提供有用的信息。
2023-08-21 23:10:31
1964
5

原创 Pytorch——momentum动量
一、Momentum:(动量,冲量):结合当前梯度与上一次更新信息,用于当前更新;二、Momentum的作用?主要是在训练网络时,最开始会对网络进行权值初始化,但是这个初始化不可能是最合适的;因此可能就会出现损失函数在训练的过程中出现局部最小值的情况,而没有达到全局最优的状态。momentum的出现可以在一定程度上解决这个问题。动量来源于物理学,当momentum越大时,转换为势能的能量就越大,就越有可能摆脱局部凹区域,从而进入全局凹区域。momentum主要是用于权值优化。没引入momen
2020-08-25 11:38:19
16521
5

原创 Pytorch-优化器optimizer
一、优化器:optimizer管理并更新模型中可学习参数的值,使得模型输出更接近真实标签 ;导数:函数在指定坐标轴上的变化率;方向导数:指定方向上的变化率;梯度:一个向量,方向为方向导数,取得最大值的方向;梯度下降法的计算过程就是沿梯度下降的方向求解极小值,也可以沿梯度上升方向求解最大值。参考知乎优化器的讲解,图片也是来自这里!图1.梯度下降法二、优化器基本属性defaults:优化器超参数 state:参数的缓存,如momentum的缓存...
2020-08-24 22:48:32
1630

原创 Pytorch-18种经典的损失函数
一、18种损失函数损失函数:衡量模型输出与真实标签的差异;目标函数 = 代价函数 + 正则化项(L1或者L2等,惩罚项)1、nn.CrossEntropyLoss(交叉熵损失)(1)什么是熵?:熵是信息论中最基本、最核心的一个概念,它衡量了一个概率分布的随机程度,或者说包含的信息量的大小。具体公式推导可以参考这篇博主的讲解:一文搞懂交叉损失,讲解浅显易懂!(2)功能: nn.LogSoftmax ()与nn.NLLLoss ()结合,进行交叉熵计算 nn.C..
2020-08-11 20:14:16
11047

原创 Pytorch-池化、线性、激活函数层
1. 池化层——Pooling layer2. 线性层——Linear layer3. 激活函数层——Activation layer1、池化层——Pooling layer池化运算:对信号进行 “收集”并 “总结”,类似水池收集水资源,因而得名池化层“收集”:多变少 “总结”:最大值/平均值最大值池化:import osimport torchimport randomfrom PIL import Imageimport numpy as npimport
2020-08-07 18:27:21
1219

原创 Pytorch-卷积层及其操作
卷积层1、1d/2d/3d(1)卷积运算:卷积核在输入信号(图像)上滑动,相应位置上进行乘加(2)卷积核:又称为滤波器,过滤器,可认为是某种模式,某种特征。(3)卷积过程类似于用一个模版去图像上寻找与它相似的区域,与卷积核模式越相似,激活值越高,从而实现特征提取。(4)AlexNet卷积核可视化,发现卷积核学习到的是边缘,条纹,色彩这一些细节模式卷积操作:卷积维度:一般情况下,卷积核在几个维度上滑动,就是几维卷积1d卷积2d卷积:https://mlnotebook.github.
2020-08-07 18:09:13
1329
1

原创 nn.Module创建模型
目录:网络模型创建 nn.Module属性1、网络模型创建使用nn.ModuleLeNet网络模型结构:nn.Module总结一个module可以包含多个子module; 一个module相当于一个运算,必须实现forward()函数; 每个module都有8个字典管理它的属性;Pytorch代码实现:import torch.nn as nnimport torch.functional as F# LeNet网络构建class LeNet(nn.
2020-08-06 15:34:44
476

原创 堆排序
一、堆排序堆实际上就是一个完全二叉堆,它分为两个类型:1、最大堆:任意的父节点的值都大于等于它左右孩子节点的值。2、最小堆:任意的父节点的值都小于等于它左右孩子节点的值。二叉堆的根节点叫做堆顶。根据最大堆和最小堆的特点,可以得出最大堆的顶点是整个堆中的最大元素,最小堆中的顶点是整个堆中最小的元素。最大堆满足:parent>= 2*parent+1 (左节点) && parent >= 2*parent+2(右节点)最小堆满足:parent <..
2020-07-31 12:10:26
196

原创 如何快速理解快速排序及C++、python代码实现?
1、快速排序对于给定的一个数列,首先选择一个基准元素;(这个值随意选择!) 将数列中的所有元素和这个基准元素进行比较,大于基准的数就放在基准的右边,小于基准的值就放在左边; 然后将基准值左右两边的子列看作两个新的数列,然后再对新的子数列进行重复上述1,2操作;两种方法:这两种方法都差不多,最低还是要掌握一个方法!1、填坑法:参考:https://www.cnblogs.com/curo0119/p/8588565.html2、指针交换法:参考:https://www.pianshen.co
2020-07-31 10:59:22
177

原创 Pytorch逻辑回归
逻辑回归是线性的二分类模型模型表达式:f(x)指的是Sigmoid函数,也称为Logistic函数;通过阈值0.5将所有值表示为0或者1,代表两个类别线性回归是分析自变量x与因变量y(标量)之间关系的方法 逻辑回归是分析自变量x与因变量y(概率)之间关系的方法 直接来代码:import torchimport torch.nn as nnimport matplotlib.pyplot as pltimport numpy as nptorch.ma.
2020-07-24 15:21:51
427

原创 autograd自动求导-Pytorch
1、torch.autograd.backward功能:自动求取梯度Tensor:用于求导的张量,如:lossretain_graph:保存计算图create_graph:创建导数计算图,创建导数计算图,用于高阶求导grad_tensors:多梯度权重autograd:计算图与梯度求导2、torch.autograd.grad功能:求取梯度• outputs: 用于求导的张量,如 loss• inputs : 需要梯度的张量• create_graph : 创建
2020-07-24 15:02:17
291

原创 Pytorch-计算图和动态图机制
一、计算图和动态图1、计算图计算图是用于描述运算的有向无环图计算图的两个重要元素:结点(node)和边(edge)结点表示数据:如向量、矩阵、张量边表示运算:一些数学操作2、叶子结点叶子结点:用户创建的结点称为叶子结点,如x,wtorch.tensor.is_leaf:用来查看是否为叶子结点叶子结点的用处:在反向传播之后,只有叶子结点的梯度会被保留,其他中间结点的梯度数据会被释放,以节省内存若要保存某特定结点的梯度,可以在运行反向传播函数前,补上一句tensor.retain_grad(
2020-07-23 17:52:54
406

原创 Pytorch-张量创建与线性回归
1、张量创建import torch# 设置返回随机种子的数量int型a = torch.manual_seed(1)print(a)help(torch.manual_seed)<torch._C.Generator object at 0x0000025223508DB0>Help on function manual_seed in module torch.random:manual_seed(seed) Sets the seed for generatin
2020-07-23 17:47:37
236

原创 第一章:张量的简介与创建
文章目录1、张量:就是一个多为数组(三维的)2、张量的创建2.1 直接创建张量2.2 依据数值创建2.3 依据概率创建1、张量:就是一个多为数组(三维的)一维的就是一个标量二维的就是一个数组Variable是torch.autograd中的数据类型主要用于封装Tensor,进行自动求导;data:被包装的Tensor;grad:data的梯度;grad_fn:创建Tensor的function,是自动求导的关键;用于对记录对数据使用了什么操作;requires_grad:指示是否需要梯度;
2020-07-19 08:53:49
299

原创 End-to-End Learning of Deep Visual Representations for Image Retrieval
1、主要贡献:1、利用一个大规模并且嘈杂的地标数据集,然后开发一种自动清理方法,产生一个适合深度检索的训练集;2、我们建立在最近的R-MAC区域最大激活描述符(这个是在MAC的基础上提出的局部区域方法)描述符的基础上,说明它可以被解释为一个深度和可微的体系结构,并提出了改进来增强它;3、我们用Simaese体系结构来训练这个网络,然后用一个triplet loss整合三个流;R-MAC区域最大激活描述符:该方法计算了不同尺度下的多个图像区域的基于CNN的描述子,这些描述子被汇总成...
2020-07-15 20:04:34
1185

原创 AttributeError:ImageDataGenerator object has no attribute flow_from_dataframe
from keras_preprocessing.image import ImageDataGeneratorvalidation_generator = valid_datagen.flow_from_dataframe(val_data, directory='./tiny-imagenet-200/val/images/', x_col='Files',y_col='Class',ta.
2020-06-28 20:10:54
2314
1

翻译 DenseNet Models for Tiny ImageNet Classification(翻译+代码)
PS:个人学习记录;有问题请留言,看到会回复!谢谢!原文地址:https://arxiv.org/pdf/1904.10429摘要:本文提出了两种基于微型ImageNet数据集的图像分类模型。我们基于密接卷积网络的思想从无到有地建立了两个截然不同的网络。根据该数据集的图像分辨率,通过计算卷积层的接收场,设计了网络结构。我们还使用了一些与图像增强和循环学习率相关的非常规技术来提高模型的准确性。该网络在高约束和低计算资源下训练。我们的目标是达到60%的前1验证精度,并给出了结果和误差分析。1. 引.
2020-06-28 12:00:55
1286
1

原创 可视化一张图像的卷积神经网络的激活区域
可视化卷积神经网络的激活区域将图像的激活区域与原始图像进行比较,检查激活区域并发现网络学习的特征,发现较浅层中的通道学习颜色和边缘等简单特征,较深层中的通道学习复杂特征。下面都是基于matlab R2018b实现。1、加载预训练的网络和图像加载网络;我这里选择简单的alexnetnet = alexnet;% 读取图像im = imread('hehe.jpg');% 查看网络结构net.Layersalexnet的网络结构信息如下:ans = 25x1 Layer
2020-05-15 11:06:26
1024

原创 C++ Primer Plus (第六版)源代码
1、C++ primer source code链接:https://pan.baidu.com/s/108MKrf-miy4beBvg8lMpIQ&shfl=sharepset提取码:vxg22、C++相关中文电子书链接:https://pan.baidu.com/s/1mE5MzG7EVwSryAp-EiG2hA&shfl=sharepset提取码:yr6...
2019-10-22 15:51:40
4710
16

原创 C++ Primer Plus (第6版) 第5章课后编程题
1、输出区间的数之和#include <iostream>using std::cout;using std::endl;using std::cin;intmain (void) { int nLowerBound, nUpperBound; cout << "输入区间:"; cin >> nLowerBound >...
2019-10-22 14:46:28
277

原创 C++ Primer Plus(第六版) 第4章 课后编程题
1、输出下列的信息;名字包含多个字母;程序中将下调整成绩,向上调整一个字母What is your first name? Betty Sue What is your last name? Yewe What letter grade do you deserve? B What is your age? 22 Name: Yewe, Betty Sue Gra...
2019-10-20 10:13:02
342

原创 如何使用VGG16提取某层的特征?
1、VGG16网络结构图VGG16结构为:卷积层 + 全连接层=13 + 3 = 161、卷积层:由上图可知分为5个部分共13层,即conv1~conv52、三个全连接层,即fc6、fc7、fc8这个VGG16网络就是基于ImageNet数据集来的;它的数据集的类数为1000类;对应fc8层的输出1000fc6和fc7的输出维数都为4096;因此如果要训练自己的数据集;fc8层的...
2019-10-13 22:38:30
9790
9

原创 Tkinter 编程入门
Tkinter 编程1、Tkinter 是内置到 python 的安装包中、只要安装好 Python 之后就能 import Tkinter 库;基本的GUi都可以实现,但是如果你是要实现专业的;如果真的需要使用Python开发GUI应用,wxPython、PyQt、PyGTK等模块都是不错的选择。2、Tkinter的提供各种控件,如按钮,标签和文本框;这些控件通常被称为控件或者部件。如...
2019-10-13 10:33:48
438

原创 水仙花数、正整数的反转、百钱百鸡问题、花旗骰游戏、斐波那契数列、10000以内的完美数、100以内的所有素数
针对:变量、类型、运算符、表达式、分支结构、循环结构 的练习ps:练习内容来源于Github:python-100-Day1水仙花数 正整数的反转 百钱百鸡问题 花旗骰游戏 斐波那契数列 10000以内的完美数 100以内的所有素数1、水仙花数 水仙花数也被称为超完全数字不变数、自恋数、自幂数、阿姆斯特朗数,它是一个3位数,该数字每个位上数字的立方之和正好等...
2019-09-28 17:18:46
1229
1

翻译 C++ 结构体定义和使用
代码参考:黑马程序员匠心之作|C++教程从入门到精通1、结构体定义和使用#include<iostream>using namespace std;#include<string>//使用字符串要添加的头文件,不然报错//定义结构体:结构体属于用户自定义的数据类型,允许用户存储不同的数据类型//三种方式://1、struct 结构体名 变量名//2、...
2019-08-01 16:41:06
11302
5

原创 EOFError: Compressed file ended before the end-of-stream marker was reached
出现这种问题不要慌!在stackoverflow上看到的解释:This is because for some reason you have an incomplete download for the MNIST dataset因为MNIST数据集是运行时下载的,很可能是在下载MNIST数据时,由于网络问题, 下载不全。我们可以到自己的datasets文件夹下找到未下载完全的数据集,然...
2019-04-14 10:15:58
20642
16

原创 [keras]如何解决MNIST 数据集下载不了的问题
keras 源码中下载MNIST的方式是 path = get_file(path, origin='https://s3.amazonaws.com/img-datasets/mnist.npz'),数据源是通过 url = https://s3.amazonaws.com/img-datasets/mnist.npz 进行下载的。但是在最近的学习过程中,如果直接从官网的链接下载的话会非常的慢,...
2019-04-11 17:37:14
5235
8

原创 matlab--GUI 如何实现打开图片
在命令行窗口输入guide会自动弹出GUI的初始化状态,选择自己默认的状态,其他的也可以!然后简单绘制一个座标轴用于显示你要的图片!我的简单的GUI如下!当你编辑好界面后,在对应的.m文件里你会看到一堆函数,一开始做学习做简单界面的功能的时候,并不需要理会这些函数究竟写了什么,只需要明白你实现的控件对应的回调函数,也就是Callback函数,实现的功能代码写进函数里就行。而CreateFc...
2019-04-09 10:35:02
19832
5

原创 微信机器人
首先登陆图灵机器人注册一个属于自己的微信机器人,注册成功后可查看apikey以供后面使用!我是在pycharm中使用的,导入相应的模块即可!下面直接看代码吧!代码很简洁!# 源代码如下:# wechat autoreplyimport itchatimport requestsimport re# 抓取网页def getHtmlText(url): try: ...
2019-04-08 09:40:08
3005

原创 如何可视化卷积神经网络特征(基于matlab R2018b)
下面我就简单的说一下,也便于理解!一、先加载预先训练好的网络模型(这里呢,先以Alexnet为例,其他网络模型的应用方法都是一样的!)net = alexnet; 在matlab命令行窗口输入,如果你之前没有加载过Alexnet,也不用担心,matlab还是很人性化的,按上面的指令进行添加即可!接下来呢,我们可以看一下Alexnet的整体框架,在matlab中都是封装好的,可以借助一些...
2019-03-14 11:41:31
7624
27

原创 基于vgg16的图像检索系统(首先要先熟悉VGG16模型)
主要的流程如下:1. 首先要熟悉vgg16模型;(推荐这位博主的文章介绍,讲的比较清楚!)2. 其次就是熟悉图像检索的流程;(基于内容的图像检索技术综述-CNN 方法)以上就是我制作这个系统的全部过程;还有就是可以看一下相关的论文去学习图像检索方面的知识还有就是可以看一下相关的论文去学习图像检索方面的知识。本人是个刚接触matlab的小白,所以两种方式都采用了。第一步:首先我是看了网上其他...
2019-03-06 20:13:52
8254
10

原创 matlab深度学习——【卷积神经网络】手写字的识别
这里主要是基于卷积神经网络的手写字的识别,我是用matlab做的,如果有对卷积神经网络不太熟悉的伙伴可以搜下,网上资源比较多,我这里就不多说了,直接上代码了。%%准备工作空间clcclear allclose all%%导入数据digitDatasetPath = fullfile(’./’,’/HandWrittenDataset/’);imds = imageDatastor...
2019-03-04 21:16:39
17548
151
原创 机器故障预测:未来24小时的决胜时刻!!!
预测机器故障是保证生产安全和效率的重要任务。随着人工智能和大数据技术的快速发展,利用这些技术进行机器故障预测已经成为一种趋势。本文将探讨如何利用机器学习算法和实时监控数据来预测未来24小时内可能发生的机器故障,并提出了一种基于深度学习的故障预测模型。该模型能够自动检测和分析各种机器参数和传感器数据,识别出异常模式并预测机器故障的发生。通过实时监测和快速响应,这种故障预测模型能够帮助企业及时发现和解决机器故障,提高生产效率和安全性。
2023-09-14 13:22:17
476
原创 Pytorch-基于RNN的不同语种人名生成模型
RNN是神经网络中最酷的一种,它能够处理序列数据并建模序列中的依赖关系。想象一下,你正在看一部电影,RNN能够理解剧情的发展,识别角色之间的关系,甚至预测下一步会发生什么。在自然语言处理、语音识别、机器翻译等任务中,RNN已经取得了惊人的成果。如果你想了解更多关于这个神奇的神经网络的内容,那就快来一起探索吧!
2023-09-09 23:59:22
373
2
原创 基于ResNet18网络训练二分类模型
图像二分类是指将图像分为两个类别的任务,通常分为正类和负类。在训练过程中,使用监督学习算法和各种机器学习模型来学习特征差异,并使用精确度、召回率、F1-score等指标进行评估。图像二分类有许多应用,例如人脸识别、疾病检测、文本分类等。本文介绍了基于ResNet18网络的训练蜜蜂和蚂蚁图像的二分类模型的过程。
2023-09-03 21:02:21
1334
原创 Pytorch-以数字识别更好地入门深度学习
MNIST数据集是深度学习入门的经典案例,因为它具有以下优点:1. 数据量小,计算速度快。MNIST数据集包含60000个训练样本和10000个测试样本,每张图像的大小为28x28像素,这样的数据量非常适合在GPU上进行并行计算。2. 标签简单,易于理解。MNIST数据集的标签只有0-9这10个数字,相比其他图像分类数据集如CIFAR-10等更加简单易懂。3. 数据集已标准化。MNIST数据集中的图像已经被归一化到0-1之间,这使得模型可以更快地收敛并提高准确率。4. 适合初学者练习。
2023-08-29 23:00:04
1429
3
原创 ICPR MTWI 2018 挑战赛二:网络图像的文本检测
特别是电子商务,社交,搜索等领域,每天都有数以亿兆级别的图像在传播。图片文字识别(OCR)在商业领域有重要的应用价值,是数据信息化和线上线下打通的基础,也是学术界的研究热点。然而,研究领域尚没有基于网络图片的、以中文为主的OCR数据集。本竞赛将公开基于网络图片的中英混合数据集,该数据集数据量充分,涵盖几十种字体,几个到几百像素字号,多种版式,较多干扰背景。期待学术界可以在本数据集上作深入的研究,工业界可以藉此发展基于OCR的图片管控,搜索,信息录入等AI领域的工作。...
2022-08-14 20:46:22
2223
2
Class-Weighted Convolutional Features for Visual Instance Search.pdf
2020-12-10
tensorflow-2.3.1-cp37-cp37m-win_amd64.whl
2020-12-10
Unsupervised Part-based Weighting Aggregation
2020-12-10
tutorials.zip
2020-12-08
手写数字识别数据集(基于matlab实现)
2020-10-28
Corel1K.zip
2020-08-03
基于卷积神经网络的CO_2焊接熔池图像状态识别方法_覃科.pdf
2019-12-31
Image Retrieval via Decoupling Diffusion into Online and Offline Processing
2019-08-29
Image Retrieval using CNN and Low-level Feature Fusion
2019-07-01
基于tensorflow2.4.0版本的transformer computer vision 训练数据集是cifar10
2022-03-13
使用windows中的fonts解决ubuntu中的乱码情况
2021-12-28
Joint Feature and Labeling Function Adaptation for Unsupervised Domain Adaptation.pdf
2021-09-28
浅析软件工程对人工智能的影响.pdf
2021-04-06
CNN-Prediction-Based-Reversible-Data-Hiding-main (1).zip
2021-04-06
Aggregating Deep Convolutional Features for Image Retrieval.pdf
2021-03-09
Fast object retrieval using direct spatial matching.pdf
2020-12-25
Deep Image Retrieval:Learning global representations for image search
2020-12-25
Google Landmarks Dataset v2 A Large-Scale Benchmark for Instance-Level Recogniti
2020-12-24
Large-Scale Image Retrieval with Attentive Deep Local Features
2020-12-24
基于角点的动态加权多特征融合图像检索方法.pdf
2020-12-24
particular object retrieval with integral max-pooling of cnn activations.pdf
2020-12-17
A_Baseline_for_Visual_Instance_Retrieval_with_Deep.pdf
2020-12-17
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人