自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(139)
  • 资源 (1)
  • 收藏
  • 关注

原创 【环境搭建】ubuntu工作站搭建全流程(显卡4090)

ubuntu工作站搭建

2024-04-09 22:11:55 1065

原创 【实用工具】使用飞书机器人监控工程日志

将error,info,debug放在三个机器人上,平时可以查看,等到真正使用时,把info和debug界别日志去掉,避免发送日志影响性能。1.创建一个飞书群聊,设置-->群机器人-->添加机器人-->自定义机器人-->修改机器人名称-->添加。日志信息将包括日期、执行程序的进程和ip,最后加上日志信息。2.复制webhook地址。3.编写日志请求代码。

2024-04-09 22:05:52 448

原创 【BUG】无法发起与 typora.io:443 (2a03:2880:f10c:83:face:b00c:0:25de) 的连接 - connect (101: 网络不可达)

1. 取消 https://typora.io/linux ./ InRelease。目录中的相关文件,并将对应的软件源的行注释掉,或者将其删除。2. 要取消对特定软件源的更新,您可以编辑。

2024-04-08 20:19:26 195

原创 【pytorch函数】gather函数

输入张量是一个2行2列的张量,0表示以列为单位进行索引,index_tensor表示对应列上的索引值,比如在第0列上取1,1位置上的值填充到原来的位置,第1列上取1,1位置上的值填充到原来的位置,也就是说只能在各自列或者各自行上的相应位置的元素替换为该列或者该行任意位置的元素。

2024-04-08 20:16:14 326 1

原创 【BUG】ubuntu更新源时报错:dl.google.com:443 (172.217.24.78),连接超时

修改/etc/hosts内容。

2024-03-21 09:59:44 416

原创 【AIGC】Diffusers:加载管道、模型和调度程序

Diffusers加载管道、模型和调度程序

2024-01-28 23:49:56 1694

原创 【AIGC】Diffusers:训练扩散模型

利用Diffusers做扩散模型训练

2024-01-25 23:41:46 1550 2

原创 【AIGC】Diffusers:AutoPipeline自动化扩散生图管道

AutoPipeline超简单的实现生成自己想要的图像的管道

2024-01-25 22:24:04 1023

原创 【AIGC】Diffusers:扩散模型的开发手册说明2

扩散器被设计成一个用户友好且灵活的工具箱,用于构建适合您用例的扩散系统。工具箱的核心是模型和调度程序。然而 DiffusionPipeline 为方便起见将这些组件捆绑在一起,但您也可以解包管道并分别使用模型和调度程序来创建新的扩散系统。解构 Stable Diffusion 流水线稳定扩散是一种文本到图像的潜在扩散模型。它被称为潜在扩散模型,因为它使用图像的低维表示而不是实际的像素空间,这使得它更节省内存。编码器将图像压缩为较小的表示形式,解码器将压缩的表示形式转换回图像。对于文本到图像模型,需要。

2024-01-24 23:46:08 1273 1

原创 【AIGC】Diffusers:扩散模型的开发手册说明1

Diffusers:扩散模型开发者的福音

2024-01-24 22:56:53 996

原创 【AIGC】CLIP

CLIP多模态模型

2024-01-23 23:53:17 837

原创 【AIGC】photomaker:基于多个图像ID嵌入的定制化逼真人物照片

通过一张图或者多张图像输入,该文方法可以记住人物ID,改变属性、改变风格和混合人物ID的效果。效果SOTA。类似的工作有ipadapter,lora,Dreambooth.这些方法不是消耗算例和时间就是效果不明显,不具有泛化性。最近的一些文生图工作在结合文本提示词的情况下合成真人图片已经取得了巨大的进展。这些工作不能同时满足高效,高的ID置信度和文本控制的自由性。我们的工作PhotoMaker是一个有效的个性化文生图生成方法。可以输入任意张ID图像然后通过堆叠来保留ID信息。

2024-01-23 23:32:03 1221

原创 【代码实战】从0到1实现transformer

在本例中,值和键是编码器的输出,而查询是自注意力模型的输出。在高层次上,它基于编码器对源句子上下文的理解,并将解码器输入的部分句子作为查询(可以为空),以预测如何完成句子。但是,如果将它们设置为小于总词汇量的值(例如这种情况),则会限制矢量化器仅学习更频繁的单词,并使生僻单词成为词汇表外 (OOV)。您将看到除了嵌入和位置编码之外,您还有编码器(图的左半部分)和解码器(图的右半部分)。为了理解单词的含义,从而量化两个单词之间的相互关系,您将使用单词嵌入技术。因此,在创建此层时,您可以为其创建一个常量张量。

2024-01-21 23:29:51 949

原创 【AI理论知识】EM算法

期望最大化算法(Expectation-Maximization,EM算法)是一种。

2024-01-21 23:01:19 492

原创 【AI理论知识】高斯混合模型

高斯混合模型(GMM)是单一高斯概率密度函数的延伸,就是用多个高斯概率密度函数(正态分布曲线)精确地量化变量分布,是将变量分布分解为若干基于高斯概率密度函数(正态分布曲线)分布的统计模型。GMM是一种常用的聚类算法,一般使用期望最大算法(Expectation Maximization,EM)进行估计。

2024-01-21 22:52:26 916

原创 【shell编程入门】正则表达式

shell与正则表达式的结合

2024-01-21 22:36:10 687

原创 【shell编程入门】函数

使用function关键字或直接使用()定义函数。# 函数体。

2024-01-21 21:44:50 365

原创 【shell编程入门】shell脚本调试

在脚本中添加输出语句,显示变量的值、执行到达的位置等信息,以便您可以跟踪脚本的执行流程。命令可以用于捕获信号并执行相应的命令,帮助您在脚本中添加额外的调试信息或进行清理工作。是一个用于静态分析Shell脚本的工具,可以帮助您找到潜在的问题。添加到脚本的开头,以便在任何命令返回非零退出状态时立即退出脚本。将脚本分成小块,逐步执行以查找错误。可以在脚本执行时显示每个命令及其参数。检查脚本的语法,以确保没有语法错误。在使用管道时,可以在各个步骤中插入。在关键点检查命令的返回值,使用。命令等方式在脚本中暂停执行。

2024-01-21 20:51:07 384

原创 【pytorch框架】使用 PyTorch 进行深度学习

PyTorch 是由 Facebook 创建和发布的用于深度学习计算的 Python 库。它起源于早期的库 Torch 7,但完全重写。它是两个最受欢迎的深度学习库之一。PyTorch 是一个完整的库,能够训练深度学习模型以及在推理模式下运行模型,并支持使用 GPU 进行更快的训练和推理。这是一个我们不能忽视的平台。您可以使用pip安装 PyTorch。在撰写本文时,PyTorch 的最新版本是 2.0。每个平台(包括 Windows、Linux 和 macOS)都有预构建的 PyTorch。

2024-01-21 15:34:53 1161

原创 【AI知识片段】Transformer模型中的位置编码

位置编码描述序列中实体的位置或位置,以便为每个位置分配唯一的表示形式。单个数字(如索引值)不用于表示项目在转换器模型中的位置的原因有很多。对于长序列,索引的量级可能会变大。如果将索引值归一化为介于 0 和 1 之间,则可能会对可变长度序列产生问题,因为它们的归一化方式会有所不同。转换器使用智能位置编码方案,其中每个位置/索引都映射到一个向量。因此,位置编码层的输出是一个矩阵,其中矩阵的每一行表示序列的一个编码对象,该序列与其位置信息相加。仅对位置信息进行编码的矩阵示例如下图所示。

2024-01-21 14:59:10 1274

原创 【shell编程入门】stable diffusion webui的webui.sh脚本解析

通过webui.sh,我们可以在linux系统下安装虚拟环境,并启动stable diffuson webui。

2024-01-15 23:54:51 779

原创 【shell编程入门】条件判断

在 shell 编程中,[]通常用于条件测试。

2024-01-15 23:13:21 820

原创 【AIGC】DreamBooth:微调文本到图像扩散模型用于主题驱动的生成

DreamBooth可以让我们使用一个很小的数据集微调文生图模型,然后基于文本提示词为我们训练的的主体替换不同的场景。大型文本转图像模型在人工智能的发展中实现了显著的飞跃,能够从给定的文本提示中高质量和多样化地合成图像。然而,这些模型缺乏模仿给定参考集中受试者外观的能力,也缺乏在不同背景下合成它们的新演绎的能力。在这项工作中,我们提出了一种文本到图像扩散模型的“个性化”新方法。给定一个主题的几张图像作为输入,我们微调一个预训练的文本到图像模型,以便它学会将唯一标识符与该特定主题绑定。

2024-01-14 19:28:23 977

原创 【AIGC】AnimateDiff:无需定制化微调的动画化个性化的文生图模型

Animatediff是一个有效的框架将文本到图像模型扩展到动画生成器中,无需针对特定模型进行调整。只要在大型视频数据集中学习到运动先验知识。AnimateDiff就可以插入到个性化的文生图模型中,与Civitai和Huggingface的文生图模型兼容,也可以与自己微调的大模型兼容。随着文本到图像模型(例如,Stable Diffusion [22])和相应的个性化技术的进步DreamBooth [24] 和 LoRA [13] 等产品,每个人都可以以可承受的成本将他们的想象力体现成高质量的图像。

2024-01-14 17:45:10 1889

原创 【AIGC】IP-Adapter:文本兼容图像提示适配器,用于文本到图像扩散模型

IPAdapter能够通过图像给Stable Diffusion模型以内容提示,让其生成参考该图像画风,可以免去Lora的训练,达到参考画风人物的生成效果。通过文本提示词生成的图像,往往需要设置复杂的提示词,通常设计提示词变得很复杂。文本提示可以由图像来替代。直接微调预训练模型也是一种行之有效的方法,但是需要消耗大量计算资源。并且存在模型兼容性问题。在本文中,我们介绍了IP-Adapter,这是一种有效且轻量级的适配器,用于实现预训练文本到图像扩散模型的图像提示功能。我们的 IP 适配器的关键设计是。

2024-01-13 23:56:55 3132 11

原创 【AIGC】Controlnet:基于扩散模型的文生图的可控性

controlnet可以让stable diffusion的生图变得可控。冻结了stable diffusion的预训练模型并重用它的预训练编码层神经网络结构与零初始化卷积层连接,从零开始逐渐增加参数,并确保微调过程中不会有噪声影响Controlnet在小数据集(小于5张万图)和大数据集(大于100万张图)上的训练表现都是稳定的。

2024-01-13 15:16:51 1607

原创 【论文综述】一篇关于GAN在计算机视觉邻域的综述

这是一篇关于GAN在计算机视觉领域的综述。

2024-01-10 23:55:07 1303

原创 【设计模式】代理模式

代理模式(代理模式):是一种结构型设计模式,它允许通过代理对象控制对另一个对象的访问。代理通常充当客户端和真实对象之间的中介,用于控制对真实对象的访问或添加一些额外的行为。

2024-01-10 22:29:27 408

原创 【设计模式】外观模式

外观模式是一种结构型设计模式,它为复杂子系统提供一个简化的接口,使得客户端可以更容易地使用这个子系统。

2024-01-09 23:32:00 726

原创 【设计模式】命令模式

命令模式是一种行为设计模式,它允许将请求封装为一个对象,从而使得可以参数化客户端对象,队列请求,或者记录请求日志,同时支持撤销操作。

2024-01-09 23:21:05 1299

原创 【设计模式】状态模式

状态模式是一种行为设计模式,它允许对象在其内部状态发生改变时改变其行为。这种模式通过将状态封装成独立的类,使得对象在不同状态下具有不同的行为,而且可以在运行时切换状态。

2024-01-08 23:12:29 1557

原创 【设计模式】 模板方法模式

模板方法模式是一种行为设计模式,它定义一个算法的骨架,而将一些步骤延迟到子类中。这种模式使得子类可以在不改变算法结构的情况下,重新定义算法中的某些步骤。

2024-01-08 22:33:36 1645

原创 【设计模式】适配器模式

适配器模式是一种结构设计模式,它允许接口不兼容的类能够一起工作。适配器模式通过引入一个适配器类,将原始类的接口转换成客户端所期望的接口,从而使得原本不能一起工作的类能够协同工作。

2024-01-07 22:53:44 1374

原创 【设计模式】策略模式

策略模式是一种行为设计模式,它定义了一系列算法,并将每个算法封装起来,使它们可以相互替换。策略模式允许客户端代码选择算法的实现方式,而不必改变其使用的上下文。Context:上下文类,持有具体策略类的实例,并负责调用相关的算法Strategy:策略抽象类,用来约束一系列的策略算法(Context 使用这个接口来调用具体的策略实现算法)ConcreateStrategy:具体的策略类(继承抽象策略类)

2024-01-07 21:40:30 836

原创 【设计模式】装饰器模式

装饰器模式是一种结构型设计模式,它允许你动态地给一个对象添加额外的功能,而无需修改其代码。装饰器模式通过创建一系列装饰器类,每个装饰器类都包装了一个具体组件(component)的实例,从而实现透明的、可叠加的功能扩展。

2024-01-07 17:19:48 1100

原创 【设计模式】观察者模式

观察者模式是一种行为设计模式,它定义了一种一对多的关系,使得当一个对象的状态发生改变时,所有依赖于它的对象都能够得到通知并自动更新。在观察者模式中,有两个主要角色:主题(Subject)和观察者(Observer)。主题(Subject): 负责维护一组观察者对象,以及通知它们状态变化的方法。观察者(Observer): 定义一个更新接口,以便在主题状态变化时得到通知并进行相应的操作。

2024-01-07 15:29:42 1159

原创 【设计模式】工厂模式

工厂模式(Factory Pattern)是 程序设计中 中最常用的设计模式之一。这种类型的设计模式属于创建型模式,它提供了一种创建对象的最佳方式。在工厂模式 中,我们在创建对象时不会对客户端暴露创建逻辑,所谓的“创建逻辑”是指我必须要知道创建函数的构造函数的逻辑组成,才能创建对象。

2024-01-07 14:13:54 541

原创 【设计模式】单例模式

单例模式保证了在程序的不同位置都可以且仅可以取到同一个对象实例:如果实例不存在,会创建一个实例;如果已存在就会返回这个实例。因为单例是一个类,所以你也可以为其提供相应的操作方法,以便于对这个实例进行管理。

2024-01-06 18:44:07 1115

原创 【python高级用法】匿名函数(lambda)、map()、filter()、reduce()系列高阶函数

高阶函数是指能够接受其他函数作为参数或者返回函数作为结果的函数。在函数式编程中,高阶函数是一种强大的工具,它使得代码更加灵活、抽象和可复用。

2024-01-06 15:08:33 887

原创 【数字图像处理】万字长文的数字图像处理全貌

数字图像处理也是一个广泛而深入的领域,涉及多个章节和主题。图像获取与表示: 学习如何获取和表示数字图像,包括不同的图像格式和编码方法。图像增强: 改善图像质量,使其更适合特定应用,例如增加对比度、降噪或锐化。空域滤波: 在图像的像素级别进行操作,如平滑、锐化和边缘检测。频域滤波: 将图像转换到频域,进行频域滤波操作,如傅里叶变换和频域滤波器。图像压缩: 减小图像文件大小,以便更有效地存储和传输,包括有损和无损压缩方法。颜色图像处理: 处理彩色图像,包括颜色空间转换、颜色增强和彩色图像

2024-01-05 23:25:32 1160

常用数据集集锦.zip

1.mnist数据集:整个数据集由来自 250 个不同人手写的数字构成,其中 50%是高中学生, 50% 来自人口普查局的工作人员。训练集:60000,测试集:10000 2.imdb数据集:这数据集包含了50000条偏向明显的评论,其中25000条作为训练集,25000作为测试集。label为pos(positive)和neg(negative)。 3.boston_housing数据集:数据来自1970年代,波斯顿周边地区的房价,是用于机器学习的经典数据集。该数据集很小,共计506条数据,分为404个训练样本和102个测试样本。 4.cifar-10数据集:CIFAR-10数据集由10个类的60000个32x32彩色图像组成,每个类有6000个图像。有50000个训练图像和10000个测试图像。 数据集分为五个训练批次和一个测试批次,每个批次有10000个图像。测试批次包含来自每个类别的恰好1000个随机选择的图像。训练批次以随机顺序包含剩余图像,但一些训练批次可能包含来自一个类别的图像比另一个更多。总体来说,五个训练集之和包含来自每个类的正好5000张图像。

2020-05-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除