自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(86)
  • 收藏
  • 关注

原创 ​ChatTTS:Win11本地安装和一键运行包!

ChatTTS 是一个专为交互式语音准备的AI语音合成项目,特点是自然,逼真,可把控声音细节,能说能笑能停顿。具体内容,已经在另外的文章中介绍过。本文主要是关注两个点。

2024-06-05 01:23:03 1419 1

原创 ChatTTS在线运行,Colab笔记本和使用方法!

这个项目的模型并不是很大,依赖也不多,硬件要求也不算高,在Colab上运行非常方便。只要能打开Google,并有用谷歌帐号,这种方式用起来会非常简单。如果无法访问外网,可以看下一篇文章,在本地电脑上运行软件。修改之后,运行一下,语音就会更新。是一个很不错的语音合成项目,项目也提供了一个.ipynb文件,可以快速运行体验。点击“>”符号,可以展开代码块,看到具体的代码和运行日志。运行完成会自动播放语音,如果有需要,可以邮件保存到本地。模型加载成功之后,就可以进入运行推理的环节了。首次运行,会跳出一个提示。

2024-06-05 01:11:52 501 2

原创 AI语音:ChatTTS 真有点东西啊!

ChatTTS是一款专为对话场景设计的语音生成模型,适用于AI助手对话、对话语音和视频介绍,支持中英文。它优化了对话任务,实现自然流畅的多说话人语音合成,并能控制细粒度的韵律特征,如笑声、停顿和插入词。ChatTTS在韵律方面表现卓越,提供预训练模型,支持进一步研究。

2024-06-05 00:57:22 712

原创 OpenAI最新模型GPT4o十个牛逼的应用场景!

OpenAI真是要压着谷歌打么?哈哈!直接赶在谷歌之前开了一个新品发布会。今天凌晨直播,早上一起来就发现已经可以体验新模型了。从录播内容来看,并没有传言的GPT5,也没有所谓的搜索功能。但是,这次更新依旧出彩。其实奥特曼在X上早就说了,不是gpt5,也不是搜索,但对他来说像魔法一般。整个发布会看下来,也是有一种未来已来的感觉。很明显,ChatGPT早已不再是一个文字模型了。它可以。这很容易,让人联想到科幻电影《Her》。很明显,Sam也是朝着这个目标去的。

2024-05-14 17:30:46 1095 1

原创 AI试衣IDM-VTON,Windows11本地安装配置记录!

昨天我们已经介绍过IDM-VTON这个开源项目了。通过这个软件可以轻松实现一键换衣服。昨天,简单演示了一下在线使用。今天,来演示如何安装到本地电脑上!本地配置会有一定的专业性,懂的人可以参考下。不懂得直接拉到最后,动动手指!我会发一个制作好的离线软件包。闲话不多说了,直接开干!确保你本地有显卡(我用的是3090),Windows系统,已经安装Python或者Conda,GIT等软件。

2024-05-13 22:28:27 878

原创 老黄终于不穿皮衣了,分享一个AI换装AI试衣软件!

通过设置相同的种子,可以确保每次生成的图像是一致的,即使在不同的时间或不同的机器上运行相同的代码和参数。今天就来分享一个人人都可以实现的方法,而且是那种傻瓜式的不用付钱的那种,甚至可以把软件在直接装在本地电脑上运行,无拘无束的玩耍。另外说一下④自动裁剪和缩放选项,如果你提供的照片比例和样例差的比较多,可能生成的图片会有些奇怪,这种情况下可以勾选这个选项。在实践中,调整这些参数可以帮助你控制生成图像的过程和质量,实现更符合需求的结果。从这两张图片,我们可以清楚的知道,这个应用的本质还是区域替换或者区域生成。

2024-05-13 22:05:43 813

原创 ChatGPT用不了,发了没反应,终于解决了!

但是我在多次切换中发现一个细节,我用新浏览器时候,正常了一下。用不了的具体表现是,你输入内容之后,内容消失,按钮变灰,聊天界面无显示。外国人不用中文,估计也就没有这个问题,所以推上反馈这个问题的人很少。然后又切换了Chrome,Edge,Safari,偶尔行了一下。我对比了一下,手机可以,电脑不行。然后可以重新切换回自己喜欢的语言,这样就没有任何问题了。所以,这个问题,可能是由于某个语言相关的缓存导致的。(所以,我就去玩了)网页会自动刷新,然后手动刷新一下,输入内容,OK!左下角,点击用户名,点击设置。

2024-03-11 11:28:32 3990 1

原创 AI绘画:PhotoMaker Win11本地安装记录!

昨天介绍一个叫的AI绘画开源项目。挺不错的!通过这个项目可以快速制作特定人脸的AI绘画作品,相比传统的技术效果会好很多,效率也高很多。今天趁热打铁,本地电脑装装看,并且记录,分享一下!本文主要面向有一定配置基础的人,所以废话我就尽量少说了。把步骤说清楚,把命令留下,把坑填了,就收工了。会装的可以结束阅读直接去GitHub了。想努力一下的可以慢慢看,我尽量把关键信息写清楚。不想努力的直接拉到最后~~哈啊哈!

2024-01-30 22:07:51 1361

原创 玩一玩140亿参数的阿里千问!Qwen+Win11+3060

通义千问-14B(Qwen-14B) 是阿里云研发的通义千问大模型系列的140亿参数规模的模型。Qwen-14B是基于Transformer的大语言模型, 在超大规模的预训练数据上进行训练得到。预训练数据类型多样,覆盖广泛,包括大量网络文本、专业书籍、代码等。同时,在Qwen-14B的基础上,我们使用对齐机制打造了基于大语言模型的AI助手Qwen-14B-Chat。本仓库为Qwen-14B-Chat的仓库。7B大概在一个月前发布,这次发布了14B版本。

2023-09-28 23:52:32 1070

原创 玩一玩“baichuan2”,很强的中文开源模型,2060s即可流畅运行!

OpenAI ChatGPT出来后,热闹了好一阵子!先是一波大厂闭源PK。然后Meta不按套路出牌,直接放出来开源的Llama1-2后来就百花齐放了。但是外国的模型默认情况下中文支持都不好。另外很多开源模型,最简单的对话都一塌糊涂。今天来玩一个不错的中文开源模型。先来简单看下本地运行的效果和速度。还不错吧。我的感觉是,整体体验很不错!官方的测评数据来看也确实是有点强,另外这个项目文档完善,也比较容易上手。官方的项目文档非常全面。提供了详细的测试结果。提供了推理和部署的方法。

2023-09-28 23:41:08 670

原创 新一代AI换脸和人脸增强软件及使用教程!facefusion

缓存帧主要是针对视频,在视频换脸过程中,会先把视频的每一帧都转换成图片。首先,根据文末的方式获取软件并解压,请注意要解压到一个英文路径下,最好是放非C盘的根目录,比如D盘下面。roop停更了,核心开发者独立发布了一个项目,就是这个叫facefusion的项目。启动之后默认只勾选了CPU,一般来说大家都是用显卡跑,只要勾选一下CUDA就可以了。执行器就是运行设备,可以选择Tensor,Cuda,cpu。这是官方预览图,又红又紫,确实有点fusion的感觉。开关参数,主要就是保持帧率,保留缓存数据,音轨。

2023-08-31 22:36:41 3356 10

原创 AI绘画:SDXL版ControlNet模型和使用方法!

SDXL是目前最强的AI绘画基础模型,直接加载模型,就可以生成不错的效果。但是它有一个致命的问题,就是不支持ControlNet。在AI绘画中,ControlNet是一个非常重要的工具。有了它,就可以生成更加可控精准的图片。ControlNet的用途非常多,比如,控制人物姿势、线稿上色、动漫变真人、艺术二维码,光影字、ailogo...好消息是,SDXL终于也支持了Controlnet。虽然只有一个canny模型,但是至少是能用了。

2023-08-24 00:38:42 3947

原创 SD-WebUI和ComfyUI的局域网访问设置!

如何通过局域网访问AI绘画软件,这是提的一个问题,而且两个软件都问到了,我也回答过了。现在把内容整理一下发出来,大家可能用得着。SD-WebUI和ComfyUI这两个AI绘画工具都是通过浏览器来使用,但是默认情况下并不支持,在其他电脑无法上访问这个网页。如果想要在其他电脑上访问,需要进行一些简单的配置,给电脑插上“一对翅膀”。设置完成之后,可以在台式Windows上开一个软件,然后在MacBook上或者IPad进行AI绘画了,当然也支持任何带浏览器的设备。下面就来说下具体的设置方法!

2023-08-24 00:29:52 4076 2

原创 玩一玩通义千问Qwen开源版,Win11 RTX3060本地安装记录!

大概在两天前,阿里做了一件大事儿。就是开源了一个低配版的模型--通义千问-7B-Chat。这应该是国内第一个大厂开源的大语言模型吧。虽然是低配版,但是在各类测试里面都非常能打。官方介绍:Qwen-7B是基于Transformer的大语言模型, 在超大规模的预训练数据上进行训练得到。预训练数据类型多样,覆盖广泛,包括大量网络文本、专业书籍、代码等。同时,在Qwen-7B的基础上,我们使用对齐机制打造了基于大语言模型的AI助手Qwen-7B-Chat。本仓库为Qwen-7B-Chat的仓库。

2023-08-06 23:14:02 2902 13

原创 AI绘画:两组赛博咒语和ComfyUI使用方法

虽迟但到啊,上次说过要发,必然是要发滴!本来我是可以直接发的,但是我又想着发关键词的同时,最好是讲解一下用法,这样更友好。所以就拖了一天!下面先展示一下两套咒语的效果:这套咒语可以生成动物外形的赛博生物,巨头命令的画面,白色的外壳,充满未来感和科技感。这种风格有点《西部世界》的感觉。关键词(Positive Prompt):负关键词(Negative Prompt):这一套主题就有点废土末日风了,颜色偏深灰色。

2023-08-06 22:53:18 883

原创 Stable Diffusion升级版SDXL,一键运行包和18G模型分享!

今天主要分享两个东西,一个是ComfyUI软件包,一个是SDXL的两个模型。有这两个东西就可以快速出图了先来简单介绍一下SDXL的特点。Stable Diffusion XL 或 SDXL 是最新的图像生成模型,与以前的 SD 模型(包括 SD 2.1)相比,它专为更逼真的输出而定制,具有更详细的图像和构图。借助 Stable Diffusion XL,您现在可以通过改进的脸部生成来制作更逼真的图像,在图像中生成清晰的文字,并使用更短的提示创建更美观的艺术作品。

2023-07-17 23:38:22 4938 13

原创 Roop:最新离线包V1.0.1,界面全新升级,拒绝马赛克画质!

哈哈~~天天更新,天天更新,天天更新…..之前的更新一直都是并入了Next分支,这两天终于并入Main了。首先根据文末的提示,获取一个6G左右的软件包,里面已经包含了所有的东西–代码,依赖,模型,CUDA,Cudnn,FFMPEG…已经更新了,相比之前增加了一些选项,可以轻松自定义。这个问题,我有点有点…听说新版更新了,好奇宝宝的第一个问题,肯定是:更新了什么?我个人认为,这次更新最有意义的就是,清晰度拉满了!这个视频本身很小,人脸修复之后,立马变高清了。开始换脸后,界面可能会假死,命令行有进度!

2023-06-29 00:18:23 2019

原创 AI绘画:切换黑色风格,安装更棒的主题!

从Stable Diffusion 出现的第一天起,我就开始关注这个项目,后来也出过几期教程。一直以来都是只追求功能实现,不管界面的问题。现在我突然想要换一个帅气的主题了…就是这么突然!默认的白色主题太….普通…既没有设计感啊,又不GEEK!下面通过两种方式,来让界面焕然一新。

2023-06-26 11:18:40 1815

原创 AI绘画:Roop插件的使用详解!

roop插件有哪些特性,如果安装,已经在上一篇讲的非常详细了。不知道你们装得怎么样了?今天,来详细的说一说roop插件的使用。首先呢启动我们的Stable-Diffusion-WebUI,然后确保插件已经启用!选择好模型,查看插件情况,一切准备就绪就可以进入下一步。Roop的插件使用,我们一下几个角度来切入。

2023-06-26 11:02:22 4158 2

原创 AI绘画:Roop插件的特性与安装!

交叉”学科”来了!我们之前讲过可以实现单图换脸的,也讲过可以通过文字描述画画的项目。现在这两者要通过产生交汇。我们先来简单的看一下这个插件可以干什么!

2023-06-26 10:46:55 3696 3

原创 Roop:显卡GPU版软件已就位,速度提升28倍!

本来我只是想搞个GPU版,但是看代码里好像支持参数里面好像支Nvidia,Inter,AMD,Apple,既然有这个内置参数,我为啥不在界面上加个选择呢?如果之前已经用过CPU版,就不需要点了,直接点击“启动GPU.exe” ,如果没有显卡或者配置不好,可以使用“启动CPU.exe”我在本地的一台电脑行做了个简单的对比,同一个小视频,CPU要5分多钟,GPU只要12秒。但是,当我界面写好,事件写好,运行后缺发现木有效果…这次的版本,准确来说是GPU+CPU都可以,另外是代码更新到了最新。

2023-06-26 10:28:05 1604

原创 Roop:单图离线版软件包及使用方法!

其实这东西都挺好的,又快又方便,几乎没有任何硬件要求,点一点就可以搞定了。照片肯定是要选有人脸,清晰,完整,正面的图片(路径和文件名不要有中文,不要有中文,不要有中文)。既然是离线版,肯定要考虑到“局域网”用户,所以我想了个办法,先把东西放在压缩包里,点一下,会自动把文件放到指定位置。处理大概分了三个阶段,第一阶段是视频分割,然后处理,最后是合成。还有一个问题,roop刚上的时候是没有限制涩涩的,但是很快就加入了NSFW的检测。通过事先的设置,或者最后的路径提示,找到视频,打开,就可以看到效果了。

2023-06-05 13:57:54 6183 18

原创 Roop:Colab脚本使用方法!

替换之后,重新点击⑤就好了。上传成功之后,把原来的1.jpg和2.MP4删除,把你自己上传的照片和视频改成这两个名字,然后运行第⑤步就可以了。文件不是很大的话,可以直接右键点击roop_colab文件夹,点击上传,找到电脑上的视频文件上传就可以了。​AI领域人才辈出,突然就跳出一个大佬“s0md3v”,开源了一个单图就可以进行视频换脸的项目。主要是,简单,快速,简单,快速,简单,快速!第⑤运行完成之后,会生成一个叫out.mp4的视频文件,这个就是换脸后的文件了。在左侧的文件管理器中,右键,下载就可以了。

2023-05-31 16:49:46 1500

原创 AI绘画:Lora模型训练完整流程!

关于AI绘画(基于Stable Diffusion Webui),我之前已经写过三篇文章,分别是。整体来说还是比简单的,搞个别人的模型,搞个提示词就出图了。今天来一个有些难度的,自己训练一个LoRA微调模型。

2023-05-10 18:29:57 16676 11

原创 AI绘画第三步,用Lora创造逼·真的小姐姐!

无论虚拟世界多么繁荣,真实的东西,都有让人不可抗拒的魅力,AI绘画也是如此。今天就来讲讲如何使用ChilloutMix和Lora画出特别“逼·真”的小姐姐,在虚拟中追求真实,这其实也是我们这个系列的核心目标。ChilloutMix是什么?从本质来说,它就是众多的StableDiffusion模型(checkpoints)中的一个。它最大的特点就是可以画出超级逼真的亚洲小姐姐,也正因如此,一发布就火遍全网。目前网上看到的可以以假乱真的AI小姐姐都是基于这个模型。

2023-03-27 19:00:00 13691 10

原创 AI绘画第二步,抄作业复现超赞的效果!

上一篇,讲了如何安装AI绘画软件,但是装完后发现生成效果很渣!而网上那些效果都很赞。真的是理想很丰满,现实很骨感。今天就是来聊聊如何抄作业,最大程度的还原那些超赞的效果。换一种说法就是,教大家如何使用别人的模型(Checkpoint Merge),以及如何设置参数。下面就按步骤,一步一步来了!

2023-03-05 09:27:51 5626 3

原创 AI绘画第一步,安装Stable-Diffusion-WebUI全过程 !

别玩那些小孩子的玩意儿了,大人应该玩这些^_^!我是真没想到,AI绘画已经进化到这种程度了。实在是太!逼!真! 了!不上重马赛克都不敢贴图!

2023-02-28 09:56:59 46682 42

原创 DFL3:软件版本的选择和安装详解

这本是一个简单的问题,但是对于新手而言,所有问题,总是说的越清楚越仔细越好。我之所以这么说,肯定是有人问了。所以我就专门开一篇文章来说一说,软件版本的异同,以及如何选择。针对不同的语言,不同的硬件,不同的性能需求有不同的选择方式。说完版本过,说一下安装方法和注意点。

2022-11-29 20:32:22 1615

原创 【AI绘画】NovelAI泄露版本地安装全过程

这几天NovelAI模型泄露了。那就凑巧了,就以这个模型为例。完整的介绍一下stable-diffusion-webui本地安装方法几乎是从零开始说起(除了不教操作系统安装)。WebUI就是stable-diffusion的可视化版本!

2022-10-13 09:41:43 11095 15

原创 隐写术,图片中隐藏的秘密!

仔细对比下面两张图片,你能发现什么异样么?图片1:图片2:如果你不是有啥超乎常人的特殊技能,应该看不出什么差别。即便能看出差别,也无法得知后背的含义。其实,我在这里用了“数字隐写术”,在图片中添加了特别的文字信息。只有知道方法和密码的人才能解密。隐写术是一门关于信息隐藏的技巧与科学,所谓信息隐藏指的是不让除预期的接收者之外的任何人知晓信息的传递事件或者信息的内容。

2022-08-24 23:00:00 2203

原创 DeepFaceLab3:工作目录和基本概念

上一篇文章我们已经讲了安装DeepFaceLab所需要的软硬件环境。正常来说就可以进入安装,实操的阶段了。但是,我觉得安装之前还是要先结合workspace来讲一些概念,这样用起来会更加顺畅。workspace这个是软件自带的目录,安装完之后就已经存在了。工作目录里都有啥?workspace主要包含如下文件: data_dst(目标素材) data_src (源素材) model (模型) data_dst.mp4 (目标视频) data_sr.

2021-09-13 23:17:10 3079 1

原创 DeepFaceLab:快让rtx30系列的提取速度翻倍吧!!!

针对rtx30系列的Build版本已经出现了有一阵子了,但是提取速度让热抓狂。对于那些动辄几千几万张图片的人来说,光一个提取就可以让人崩溃了。3090用户内心os:好不容易抢了个30的卡,没想到提取速度还比不上10系列,这是闹哪样?gtx1070表示:1万多rtx3090还不如我跑得快,哈哈哈!具体有多慢?没有对比就没有伤害。下面用默认的data_dst素材比较一下!GTX1070下面,802版,大概花了15分钟,每秒1.8张图片!GTX1070下面,1211版,大概花了18分钟

2020-12-14 23:38:54 5825 2

原创 Google Colab V100 +TensorFlow1.15.2 性能测试

为了对比滴滴云内测版NVIDIAA100,跑了一下Google Colab V100 的 TensorFlow基准测试,现在把结果记录一下!运行环境平台为:Google Colab系统为:Ubuntu 18.04显卡为:V100-SXM2-16GBPython版本: 3.6TensorFlow版本:1.15.2显卡相关:测试方法TensorFlow benchmarks测试方法:https://github.com/te...

2020-09-18 09:52:34 1418

原创 滴滴云A100 40G+TensorFlow1.15.2 +Ubuntu 18.04 性能测试

今天拿到了滴滴云内测版A100,跑了一下 TensorFlow基准测试,现在把结果记录一下!运行环境平台为:滴滴云系统为:Ubuntu 18.04显卡为:A100-SXM4-40GBPython版本: 3.6TensorFlow版本:1.15.2 NV编译版系统环境:测试方法TensorFlow benchmarks测试方法:https://github.com/tensorflow/benchmarksresnet50_v...

2020-09-18 09:44:19 869

原创 矩池云 RTX 2080 Ti+Ubuntu18.04+Tensorflow1.15.2 性能测试!

今天为了对比滴滴云NVIDIAA100,特地跑了一下RTX2080的TensorFlow基准测试,现在把结果记录一下!平台为:矩池云系统为:Ubuntu 18.04显卡为:RTX 2080 TiPython版本: 3.6.10TensorFlow版本:1.15.2显卡相关内容如下:系统配置如下:测试方法:https://github.com/tensorflow/benchmarksResnet50 BS64...

2020-09-18 09:30:25 675

原创 NVIDIA A100跑DeepFaceLab,日迭代破百万,像素上800!

昨天用滴滴云的A100做了下TenorFlow的基准测试,可能略显抽象!今天来跑跑DeepFaceLab,整体来说A100还是挺强! A100也应该未来一两年最强的深度学习显卡了,毕竟是单张七八万,一套DGX 一百多万的卡!已经连续看了两天命令行和数字了,头围有所增加!环境配置:主角:A100-SXM4-40GB,配套:CUDA11,Tensorflow 1.15.2 NV特别版,系统:Ubuntu 18.04安装注意点:显卡相关支持和深度学习框架已经安装好了,只需要获取De

2020-09-18 00:54:59 3780

原创 滴滴云A100 40G 性能测试 V100陪练!

眼看游戏卡RTX3080 发售在即,我终于等到了滴滴云(感谢)A100的测试机会。因为新卡比较紧张,一直在排队中,直到昨天才拿了半张A100...今天终于上手了单张40G的A100,小激动,小激动,小激动!!!基于安培架构的最新一代卡皇(NVIDIA GPU A100 Ampere)可以搞起来了。Part 1:系统环境A100正处于内存阶段,官网上还看不到。内测通过ssh连接,ssh连上去之后大概看了下系统环境。操作系统,CPU,RAM数据如上。重点关注GPU:A100-SXM4-40GB.

2020-09-16 22:39:05 3874 3

原创 直播换脸后,我们来搞搞微信QQ聊天换脸!| avatarify

每次研究一个项目都需要不少精力,所以浅尝辄止是不行滴,我们必须把所有应用场景都玩一遍。而且是 step by step 带大家一起玩!今天我就来说说如何在视频聊天中使用实时换脸技术。支持QQ,微信,ZOOM,Skype,Slack 等视频聊天,视频会议软件。直播的思路是通过屏幕截取推流,而视频聊天的核心思路是把换脸后的窗口模拟成一个虚拟摄像头。其他东西,在之前的文章里已经说过了,今天就废话不说直接开干咯。假设我们已经在本地安装好了avatarify ,关于如何安装可以参考《换脸直播搞起,效果

2020-08-24 14:01:02 17191 6

原创 无需绿幕的全自动视频抠图工具|unscreen

早前我有分享过用AI算法去除图片背景的方法(AI抠图),最近看到群里有人分享了一个视频抠图的网站。同大家一起分享下。抠图是一个相关行业的必备技能,但是大部分小白只有看大声炫技的份。此时多么希望能有一个一键抠图的工具啊。你有需求,自然会有人供给!unscreen就是这样一个工具。这是一个可以移除视频背景的工具,100%全自动,and 免费。这是一个网站,网址为:https://www.unscreen.com/下面先看下官方说明,然后简单说下操作。绿幕再见过去,制作无背景的

2020-07-02 23:32:54 18290 2

原创 DeepFacelab更新:分辨率提至640,效率翻倍!

这几天又更新了,好事儿是又有新功能可以玩了,“坏事儿”是感觉又要升级设备了。其实,总的来说这次更新,对低配高配玩家都有好消息。1.对于高配玩家,可以跑更高像素的模型。2.对于低配玩家,那些跑不起的像素也能跑起来了。下面就来说说重点更新内容:1.模型训练参数resolution的最大值从512调到了640。这意味着对于高配玩家来说可以跑更大的模型,大到640x640。这是一个什么样的概念呢?比如一个720P的视频分辨率是1280x720,现在模型的分辨率就可以达到64...

2020-06-24 22:46:07 6418 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除