- 博客(312)
- 资源 (6)
- 收藏
- 关注
原创 记录一下安装腾讯混元文生图模型的艰辛历程
这篇文章里面提到的一模一样,他是安了没用C++ ABI编译的包错了,改成编译的就好了。但我现在安的就是他推荐的,然后我试着去反向解决,安他会报错的那个包,也就是。可以看到报错的包位于.local里面,而我前面的安装截图里面,也可以看出是在.local里面安的,所以我相当于是把他的版本覆盖掉了。最后kk终于发现了上面被红框框起来的那句话,原来是因为我的虚拟环境是用su模式装的,所以常规模式下无法安装进去,强行给我装到了外面。其实上面的问题是安装1.1版本的模型导致的,可以用下面的命令安装1.2模型。
2024-09-03 16:20:24 783
原创 ollama修改模型问答的上下文长度(num_ctx)
在使用ollama做大模型问答的过程中,发现存在着当输入问题过长之后,模型无法回答的问题。经过查询资料,这与一个叫做num_ctx的参数有关,它用来控制对话上下文的长度,在大模型动辄支持32k上下文的当下,ollama居然丧心病狂地把这个参数默认设成了2048也就是2.048k,真是叔可忍婶不可忍!ollama的每个模型都有个配置文件,这里需要在原基础上生成一个新的配置文件,再根据这个配置文件去生成新的模型,以。,但是缺点是只能在命令行中生效,通过API调用是无效的,下次从命令行再启动也是要重新输的。
2024-08-01 14:41:32 1342 1
原创 frp基于阿里云ECS实现内网穿透
第一次通过Workbench通常是无法连接的,此时进入VNC连接界面,通过重置密码设置连接密码和连接方式,之后就可以连接了。这个放行要走两步,第一步是从安全策略放行,第二步是从宝塔面板放行。首先花99元购买一台服务器一年的使用权。拉到最下面查看宝塔面板的地址。进入宝塔面板,批量放行端口号。进入实例页面安装宝塔面板。手动修改安全组访问规则。进入如下页面查看详情。
2024-05-17 23:36:09 617 1
原创 Stable Diffusion系列(七):实现SD webui的全盘汉化
我有zh_CN.json、zh-Hans(Stable)、zh_Hans.json这三个用来翻译英文到中文的文件,它们包含的内容(英文原文:中文翻译)是部分重叠的,并且翻译质量逐个递减。的文件,打开之后如下图所示,每一行的第一部分是英文原文,第二部分是要翻译成的中文,插件会自动完成替换。但是在实际的界面中,仍然有很多东西没有更新,原来这已经是几个月前的文件了,跟不上进度了。的顺序,完成JSON文件的合并,代码如下所示。于是我又搜了搜其他的本地化插件,发现还有其他的简体字插件。插件安装完成后,进入。
2024-05-16 16:42:32 543
原创 基于NAS搭建VPN:一次失败的经历
在选择 VPN 协议时,需要考虑多种因素,包括安全性、性能、兼容性和可配置性。在计算机网络和加密技术中,CSR(Certificate Signing Request)、CRT(Certificate)和KEY(Private Key)是几个关键的术语,它们在数字证书的生成和验证过程中扮演着重要角色。,也就是证书过期了,而VPN Server 是依赖了群晖设置中的证书,查看一下群晖证书,果然都过期了。在套件中心搜索VPN,点击VPN Server套件,参考。,尝试连接,可恶,居然报错了。
2024-05-04 16:01:05 2546
原创 为家庭公网IP配置DDNS域名
果然我分到的并不是固定的公网IP,而是会定期变化的。为了免受定期在配置文件中更换IP之苦,我决定将变化的IP与固定的域名绑定,过上懒人该过的快乐躺平生活。DDNS服务的核心功能是跟踪用户IP地址的变化,并在IP地址发生变化时自动更新域名解析记录,确保域名始终指向当前的IP地址。这样,即使用户的IP地址发生变化,其他网络用户仍然可以通过静态域名访问到用户的服务或设备。进入解析设置页,将域名与当前的IP绑定,虽然生效时间写着十分钟,不过实测是立即生效的。将客户端的toml中文件的IP地址设置为域名。
2024-05-01 23:55:50 1529 2
原创 frp改造Windows笔记本实现家庭版免费内网穿透
之前一直用花生壳远程控制一个服务器,但最近内网的网络策略似乎发生了变化,花生壳相关的域名都被屏蔽了。此时我恰好发现家里分配的宽带是公网IP(如果不是可以打电话申请一个),于是干脆选择自己动手丰衣足食了。一开始我的想法是给家里的路由器刷完固件之后安装一个内网穿透工具,但是发现两个路由器都不行,一个是电信定制的,没有现成的刷机工具;另一个路由器内存太小了,就剩几十KB,没什么操作空间。顺着这个思路,最好的解决方案似乎就是买一个大几百的高端路由器,但我实在是不想住在一个路由之家里面。
2024-04-21 18:21:41 2210
原创 使用docker打包当前服务器的neo4j环境
Docker 是一个开源的应用容器引擎,它允许开发者将应用程序及其依赖打包到一个可移植的容器中,这样应用程序就可以在任何支持Docker的平台上运行,而无需担心环境差异。当运行一个Docker容器时,它会加载一个镜像并运行它。Docker在容器内部创建一个隔离的环境,这个环境被称为容器。容器与宿主操作系统共享内核,但拥有自己的文件系统、网络接口和进程空间,从而实现资源隔离和安全性。
2024-04-21 18:14:38 504
原创 Stable Diffusion系列(六):原理剖析——从文字到图片的神奇魔法(潜空间篇)
论文提出了一个名为Latent Diffusion Models (LDM)的新模型,旨在减少直接在像素空间中训练扩散模型所带来的计算复杂度。提出了两阶段训练方法:首先训练一个自动编码器,学习一个低维的潜在空间表示,然后在自动编码器的潜在空间中训练扩散模型。这显著降低了训练和推理的计算复杂度。引入交叉注意力机制:通过将交叉注意力层添加到UNet中,LDM可以处理各种条件输入,如文本或语义布局,并实现高质量的图像生成。
2024-02-18 17:06:12 2405
原创 Stable Diffusion系列(五):原理剖析——从文字到图片的神奇魔法(扩散篇)
这是解开图片生成之谜的第一把钥匙,原文是发表于NIPS2020的Denoising Diffusion Probabilistic Models,下面我们就如庖丁解牛般,尝试洞察里面的每一丝细节。先从标题说起,很久没有看到过这么简明扼要的论文名了,用三个词就完美概括了DDPM的核心思想,去噪(Denoising)是方法、扩散(Diffusion)是架构、概率(Probabilistic)是媒介。至于目的,当然是去生成以假乱真的图片。图片生成不是什么新鲜事,VAE和GAN都是曾经的研究宠儿,它们在生成图片时都
2024-02-15 14:47:57 1924 1
原创 Stable Diffusion系列(四):提示词规则与使用
所谓提示词,也就是文生图中的文,由连贯的英语单词或句子组成。还是上面的例子,总共30步,前20灰发,后10蓝发。以DreamShaper8 SD1.5为例。前百分之30灰发,后百分之70蓝发。在此基础上,让眼睛变成黄蓝混合。前一半是蓝发,后一半去除蓝色。不是很好用,只有蓝色。
2024-01-28 19:13:25 2583
原创 基于LLaMA-Factory的微调记录
由于不需要考虑多轮对话,所以history可以不要,这里采用了两种数据集的组织方式,一种是只有instruction和output,把问题作为instruction,另外一种是把问题作为input,把回答问题这一要求作为instruction。微调时一般需要准备三个数据集:一个是自我认知数据集(让大模型知道自己是谁),一个是特定任务数据集(微调时需要完成的目标任务),一个是通用任务数据集(保持大模型的通用能力,防止变傻)。测试的大模型可以使用这些,注意要下载最新版,老版的模型结构不太匹配。
2024-01-26 17:16:42 5735 16
原创 无法打开jupyterhub网页问题的解决历程
我把每个端口都在浏览器中输了一遍,有一些可以访问到本地的文件夹,拿到了一些关于连接和配置的文件,当我试到26280的时候,jupyterhub网页居然正常打开了!原来,这就是网址对应的端口号,当我以IP+端口号访问的时候,可以绕开网页方式访问导致的缓存错误,因为这样就相当于直接访问本机存放的js文件,不会有乱七八糟的中间过程。去年的第一场雪下过几天之后,我的jupyterhub网页突然无法使用了,打开是能打开,但是一片空白,没办法做交互,也没有明显的报错。打开本地的nmap文件,里面是这样的。
2024-01-19 10:42:44 1477
原创 知识图谱gds使用记录
在每次传播迭代中,每个节点将其标签更新为其邻居节点中最常见的标签。这个过程会不断重复,直到标签达到收敛,即每个节点的标签与其邻居节点的大多数标签相同。通过标签的传播,密集连接的节点组很快就会形成共识,并形成一个社区。在传播结束时,只有少数几个标签会保留下来,大多数标签会消失。算法的核心思想是通过在网络中传播标签来形成社区。PageRank算法考虑节点的入度和出度计算重要性,可以识别影响力较大的节点。上述代码中第二个参数是节点,第三个参数是关系,可以通过字符串或列表的形式根据单个或多个节点和关系建图。
2024-01-09 15:24:13 523
原创 neo4j图数据库的简单操作记录
知识图谱文件导出首先停止运行sudo neo4j stop然后导出数据库导出格式为:具体命令如下sudo neo4j-admin database dump --to-path=/home/ neo4j最后重启sudo neo4j start知识图谱外观修改在网页点击节点,选中一个表情后点击,可修改其颜色、大小和显示的属性。
2024-01-08 11:21:31 789
原创 基于数据库和NER构建知识图谱流程记录
这样跑是能跑,但是速度会非常慢,因为每次都从所有的节点里面找。我们可以观察到,对某种特定的关系,头实体和尾实体都属于某种特定的节点类型,因此可以先把所有这一类型的节点存到一个字典里,再在这个字典里做匹配,这也是目前实现的算法。为了将数据库中字段解析为知识图谱的内容,需要完成以下几部分的功能:一是直接与数据库交互,二是通过NER解析文本描述内容,三是计算时间和地点间的相似度。其实知识图谱的构建常常是节点和边同时构建的,但由于我们的数据量非常大,同时构建逻辑比较复杂,所以采取了先统一建节点,后统一建边的逻辑。
2024-01-05 12:09:09 1205
原创 Linux使用screen后台执行命令
Screen是一个在Linux/Unix系统下的命令行窗口管理器,它允许用户在一个终端窗口中同时运行多个命令行会话,并在这些会话之间轻松切换。Screen还提供了一些其他功能,例如后台运行会话、断开连接后保持会话等。
2024-01-04 10:56:44 852
原创 Stable Diffusion系列(三):网络分类与选择
我一般把对模型的描述放在notes里面,因为如果放在描述里会显示在选择界面里,看着非常乱,点击Replace preview可以将模型封面图替换为当前生成的图片。炫耀一下我的老婆们:sd-webui-prompt-all-in-one插件:用于选择模型、超网络、Lora和嵌入。
2023-12-23 17:00:29 3214 3
原创 一文读懂Langchain:ChatGLM3和ChatGPT的Agent调用分析
首先下载上面给出的github项目并安装环境,然后想想要测试什么问题。请问下面这个字符串的长度的三次幂是几:XXX,理想情况下,Agent加持的大模型会分析出需要调用获取字符串长度和计算三次幂这两个工具,然后连续调用它们得到正确的结果。所以第一步就是要把这两个工具定义好,在这个项目里,只要在Tool文件夹下定义好xxx.py和xxx.yaml这两个文件,xxx这个工具就算可以使用了,我们对这两个工具的定义如下,注意这些工具的输入和输出都得是字符串。
2023-12-08 13:55:25 5997 5
原创 基于Langchain的txt文本向量库搭建与检索
这里的源码主要来自于Langchain-ChatGLM中的向量库部分,做了一些代码上的修改和封装,以适用于基于和(文件名为库表名,文件内容为库表中的字段及描述)对数据库表进行快速检索。
2023-12-04 19:09:27 1103
原创 主流开源大语言模型的微调方法
支持市面绝大多数模型的QLoRA和全量参数微调。支持市面少数模型的QLoRA和全量参数微调。全量微调和 P-Tuning v2。全量微调和 P-Tuning v2。全参微调、LoRA以及Q-LoRA。支持市面绝大多数模型的各种微调。
2023-11-21 11:11:25 896
原创 华为昇腾云平台适配Baichuan2大模型记录
文件发现报错:ValueError: The pipeline stage 2 in auto_parallel_context is not equal to the pipeline_stage 1 in the config.run_baichuan2_7b.yaml`,发现默认设备数是16卡,对应的pipeline_stage为2,但实际是8卡,那就改成下面的试试看。,将Baichuan2_7B_Chat.ckpt文件复制进去,将。点击镜像管理,突然发现有个2_2_0,赶紧新建了一个,成功。
2023-11-09 12:28:31 1539 5
原创 Stable Diffusion系列(二):ControlNet基础控件介绍
在下载插件时可以看到,ControlNet 插件的星数遥遥领先,远超其他妖艳贱货。究其原因,是因为其大大增强了使用者对图片生成过程的控制能力,图片的生成同时受到提示词和提示图的影响,使得文生图由抽卡游戏变成了一个更具确定性的创作工具。ControlNet位置位于文生图界面下方,记得要勾选启用,可控类型包括这么点东西:接下来我将以喜闻乐见的熊猫花花为例,演示一下关于ControlNet的高端操作。
2023-11-01 09:32:07 1264
原创 Stable Diffusion系列(一):古早显卡上最新版 WebUI 安装及简单操作
该插件的原理是在调用和完成时分别向原始模型中注入(inject)和删除(restore)时间步模块从而生成连续变化的GIF,由于整体版本过老,直接执行该插件会报没有insert和pop方法的错误,因此需要在。首先在模型左侧选择Stable Diffusion模型及其对应VAE,然后输入正向和反向提示词,在下面点击生成相关设置如采样方法、采样迭代次数和宽高等。lora是一类对模型进行微调的方法,是一系列参数量较小的模型,在与原始模型结合后,可以对生成图片做特定修饰,可以理解为化妆技术。
2023-10-29 17:46:02 2226
原创 stable diffusion如何解决gradio外链无法开启的问题
为了确认gradio开启不了是gradio库的问题还是stable diffusion的问题,可以先执行这样一段demo代码。里,可以看到这样一层。
2023-10-21 12:03:40 786
原创 langchain-ChatGLM源码阅读:模型加载
:在这一部分代码中,通过调用 get_balanced_memory 函数来获取一个适当的内存分配方案,执行完后每个卡都会产生少量的显存占用。作用:将配置对象的类与模型类或对象建立关联,以便根据配置来获取相应的模型类或对象。作用:遍历权重文件分片,逐一加载这些分片,但会跳过那些只包含磁盘上载权重的分片文件,显示加载的进度条,也就是下面这个东西,但此时模型权重还没有加载到显存中。包路径:site-packages/transformers/models/auto/auto_factory.py。
2023-08-19 12:55:25 1548 1
原创 langchain-ChatGLM源码阅读:参数设置
虽然放在了模型配置那一页,但实际上还是用来控制上下文关联里面的内容条数k的,不知道为什么写了两遍。其实就是要存多少历史记录,如果为0的话就是在执行当前对话时不考虑历史问答。这些参数没有在前端显式地给出,而是写死在了模型定义里。
2023-08-06 00:36:10 2614
原创 langchain-ChatGLM源码阅读:前端样式
监听到前端的事件后调用的回调函数,负责实现前后端交互。需要注意的一点是,chatbot中显示新的聊天内容并不是在原来的基础上添加,而是从头到尾的重新打印,所以基本上每个函数都要传旧的history和返回新的history。使用gradio设置页面的视觉组件和交互逻辑。
2023-08-01 08:23:23 3055
原创 如何在jupyter notebook的cell中运行py文件时将传递参数写成多行
【代码】如何在jupyter notebook的cell中运行py文件时将传递参数写成多行。
2023-04-20 13:42:43 146
原创 花生壳诊断连接时出现1007错误的解决方案
找到了原因,使用2和3中的命令测试都没有得到正确结果,说明DNS有问题。在Linux平台上修改DNS,注意要用sudo获取只读文件的修改权限。在内网配置好花生壳客户端后,发现连接失败。
2023-04-07 10:53:37 4008
原创 Reasoning Through Memorization: Nearest Neighbor Knowledge Graph Embeddings论文阅读
扩展的方式是加入所谓的special tokens,为了让special tokens有明确的语义,还需要加入以下的预训练任务。看到这里我才理解整个KNN算法,给定一个最近邻居k,是在知识库中筛选出k个离给定嵌入表示最近的实体,然后用距离表示它们的概率,并与另一种方式计算出来的概率加权。知识库中以(k,v)对的形式存储实体与嵌入的关系,其中k是基于描述或三元组的嵌入,v是对应实体的名称,论文使用开源的FAISS来执行高维空间的检索算法。从包含语义信息的实体描述和包含结构信息的实体三元组两方面来构建知识库。
2023-01-27 18:16:12 812
原创 I Know What You Do Not Know: Knowledge Graph Embedding via Co-distillation Learning
这里可能是为了强调要把target entity预测对,损失函数分为两部分,前半部分是target,后面是非target,由于KL散度要处理的是分布,因此把target由标量转为向量如下图所示。论文以类似的提示词方式计算两个方向上的邻居嵌入并求和,不过反正最后是相加,所以其实没必要分开写。以一种递归的模式,上述基于三元组的重建过程可以推广到基于邻居子图的重建。传统的蒸馏学习中,用t表示老师,s表示学生,损失函数如下。是关系相关的提示词,会被加入词表中,下标对应不同的位置。共蒸馏确实利用了两个模型的互补性。
2022-10-27 13:54:20 495
Stable diffusion模型汇总,其分类存放到不同的文件夹中,包括模型名称、使用方式和效果图,对应模型文件过大,需手动下
2024-01-27
stable Diffusion webui常用嵌入文件汇总,包含不同类别的具体文件及效果图和使用说明,解压后直接使用
2024-01-27
Patterns, Predictions, and Actions.pdf
2021-07-24
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人