培根芝士-CSDN博客

原创 Stable Diffusion WebUI 更换图片背景

Rembg是一个用于去除图像背景的开源工具，能够智能地识别和分离图片中的主体与背景，生成高质量的抠图效果。

2024-05-19 23:45:02 317

原创 Stable Diffusion WebUI使用inpaint anything插件实现图片局部重绘

Inpaint Anything是一个强大的图像处理工具，它结合了SAM（Segment Anything Model）、图像修补模型（如LaMa）和AIGC模型（如Stable Diffusion）等先进技术，以实现图像中物体的移除、内容的填补以及场景的替换。无论是对图像中的任何元素进行编辑，还是对图像整体进行场景转换，Inpaint Anything都能胜任。

2024-05-17 00:32:44 857

原创解决报错：“ERROR: failed to solve: cannot replace to directory /var/lib/docker/overlay2/……”

执行 docker build 命令时报了如下错误：删除node_modules目录修改.dockerignore，把app/node_modules添加到app/node_modules中

2024-05-16 13:07:21 164

原创使用AudioCraft（MusicGen）生成音乐

模型将根据提供的描述生成一段简短的音乐，一次可生成长达30秒的音频。模型是根据库存音乐目录中的描述进行训练的，最有效的描述应该包括现有乐器的一些细节，以及一些预期的用例（例如，添加“perfect for a commercial”可能会有所帮助）。facebook/musicgen-melody：以文本和旋律为条件的音乐生成模型，也可以只使用文本。facebook/musicken-small：以文本为条件的300M转换器解码器。

2024-05-10 15:56:17 345

原创清理 Conda 和 pip 缓存

查看 Conda 缓存的使用情况。查看 cache 列表和路径。删除不再使用的包和缓存。

2024-04-29 11:19:16 985

原创 Stable Diffusion使用ControlNet:IP-Adapter实现图片风格迁移

IP-Adapter 全称是 Text Compatible Image Prompt Adapter for Text-to-Image Diffusion Models（文本到图像扩散模型的文本兼容图像提示适配器），是腾讯研究院出品的一个新的ControlNet模型，旨在使预训练的文本到图像扩散模型能够生成具有图像提示的图像。IP-Adapter是一种有效的轻量级适配器，用于实现预训练文本到图像扩散模型的图像提示能力。

2024-04-27 18:15:24 694

原创 Stable Diffusion常用提示词（Prompt）

Stable Diffusion常用提示词

2024-04-27 11:47:27 1235

原创 Stable Diffusion 常用放大算法详解

常规用法：先在低分辨率下反复画图，确定一个比较满意的图像时，再借助固定随机种子，来进行高清修复，得到分辨率更高的图像。高清修复有时候会修改图像，增加不必要的元素，可以通过调整重绘幅度进行抑制。如果只是想放大图片，可以设置为（0.3-0.5），如果想要AI自由发挥，可以设置更高的重绘幅度。

2024-04-26 16:30:41 1694 1

原创 Topaz Video AI参数详解

Topaz Video AI是一款由Topaz Labs开发的人工智能视频处理软件。这款软件利用先进的深度学习技术，为视频处理提供了多种高效、智能的工具，帮助用户快速、轻松地完成视频处理任务。

2024-04-26 00:40:18 809

原创使用IOPaint实现图片擦除路人

IOPaint 是一个免费的开源的 inpainting/outpainting 工具，由最先进的 AI 模型提供支持。

2024-04-24 21:09:18 702

原创使用IPEX-LLM加速大语音模型LLM

IPEX-LLM是一个用于在英特尔CPU和GPU（如本地PC的iGPU、独立显卡如Arc、Flex和Max）上加速本地LLM推理和微调的PyTorch库。

2024-04-22 11:27:59 395

原创 python使用Flask框架开发API

Flask是一个基于Python的轻量级Web应用程序框架。

2024-04-11 11:44:35 419

原创在Win11上部署大模型推理加速工具vLLM

vLLM是伯克利大学LMSYS组织开源的大语言模型高速推理框架，旨在极大地提升实时场景下的语言模型服务的吞吐与内存使用效率。vLLM是一个快速且易于使用的库，用于 LLM 推理和服务，可以和HuggingFace 无缝集成。vLLM利用了全新的注意力算法PagedAttention，有效地管理注意力键和值。在吞吐量方面，vLLM的性能比HuggingFace Transformers(HF)高出 24 倍，文本生成推理（TGI）高出3.5倍。

2024-04-08 10:50:46 1147 1

原创 Python实现WebSocket通信

WebSocket是一种在单个TCP连接上进行全双工通信的协议,位于 OSI 模型的应用层。与传统的HTTP请求-响应模型不同，WebSocket的最大特点就是，服务器可以主动向客户端推送信息，客户端也可以主动向服务器发送信息，实现实时性和互动性。

2024-03-25 15:39:33 944

原创使用GPT将文档生成问答对

根据文档生成问题列表。根据问题列表生成问答对。

2024-03-25 14:43:17 830

原创部署DiffSynth-Studio实现视频风格转换

DiffSynth 是一个新的 Diffusion 引擎，可以实现图片和视频的风格转换。

2024-03-21 10:35:41 923

原创使用Docker安装detectron2

Detectron2 官网安装教程是基于 linux 安装的，在 windows 上直接安装有很多问题，下面采用 docker 方式在 windows 上安装。Detectron2 是一个用于目标检测、分割和其他视觉识别任务的平台。安装Miniconda3。安装detectron2。拉取cuda116镜像。

2024-03-19 20:19:47 282

原创部署高斯喷射项目gaussian-splatting

硬件要求支持 CUDA 的 GPU，具有 7.0+ 的计算能力24 GB VRAM软件要求Conda用于 PyTorch 扩展的 C++ 编译器（Visual Studio 2019）

2024-03-18 16:45:36 550

原创 UE5 android打包

Android SDK Command-line Tools，选择Android SDK Command-line Tools (latest)修改包名、数据打包到APK，并禁用验证OBB，继续下拉，找到红色的警告，点击立即配置，自动设置项目以写入必需平台文件。Android SDK Build-Tools 35-rc1，选择30相关内容。进入 Unreal Engine，在菜单中选择“编辑”->“项目设置”选择“平台”->“Android”->“打包项目”选择“平台”->“刷新平台状态”

2024-03-14 19:43:20 1202

原创 docker run带 --gpus all 参数报错：“Auto-detected mode as ‘legacy‘ nvidia-container-cli: mount error”

启动“docker run --gpus all ...”时报错：该镜像是在Ubuntu环境下创建的，而在WSL下使用nvidia-docker启动该镜像时会报错。1. 使用docker而不是nvidia-docker启动原始镜像下的容器（去掉--gpus all）2、在该容器中删除 /usr/lib/x86_64-linux-gnu/libnvidia-ml.so.1 和文件 /usr/lib/x86_64-linux-gnu/libcuda.so.13、新开一个终端，把此时的容器打包为镜像

2024-03-11 15:25:25 1174

原创 Python调用XTTS实现声音克隆+文字转语言

XTTS 是一个语音生成模型，不需要过多的训练数据，仅使用一个 6 秒的音频文件即可将语音克隆为不同的语言。XTTS-v2 支持 17 种语言：英语（en）、西班牙语（es）、法语（fr）、德语（de）、意大利语（it）、葡萄牙语（pt）、波兰语（pl）、土耳其语（tr）、俄语（ru）、荷兰语（nl）、捷克语（cs）、阿拉伯语（ar）、中文（zh-cn）、日语（ja）、匈牙利语（hu）、韩语（ko）印地语（hi）

2024-03-11 11:49:01 1001

原创 Python调用edge-tts实现在线文字转语音

edge-tts是一个 Python 模块，允许通过Python代码或命令的方式使用 Microsoft Edge 的在线文本转语音服务。

2024-03-06 20:20:13 2934

原创 ER-NeRF实时对话数字人模型训练与部署

ER-NeRF是基于NeRF用于生成数字人的方法，可以达到实时生成的效果。

2024-03-03 16:02:57 1899 2

原创 Python调用pyttsx3实现离线文字转语音

pyttsx3是 Python 中的文本到语音的离线转换库。带默认选项的朗读功能的单行用法。

2024-03-01 18:51:48 730

原创解决“source ~/.bashrc 无效”的问题

dockerfile 在执行 RUN source ~/.bashrc 的时候会报错：dockerfile默认的shell是sh，无法使用source在 RUN source ~/.bashrc 前面添加以下指令，将shell改为bash

2024-02-28 14:22:34 1386

原创部署PhotoMaker通过堆叠 ID 嵌入自定义逼真的人物照片

PhotoMaker只需要一张人脸照片就可以生成不同风格的人物照片，可以快速出图，无需额外的LoRA培训。

2024-02-28 12:26:25 707

原创 Huggingface配置镜像

首先确保已经安装了huggingface_hub依赖包。

2024-02-27 20:16:09 2200

原创部署roop实现视频人脸替换

roop只需要一张人脸的图像，就可以替换视频中的脸。不需要数据集和模型训练。

2024-02-27 20:03:27 418

原创在Win11下安装pytorch3d

一般cl.exe的地址是在Microsoft Visual Studio***\VC\bin\amd64\里面。以管理员身份打开“x64 Native Tools Command Prompt...”安装成功后，将cl.exe的路径添加到环境变量Path中。在conda环境下，进入pytorch3d目录执行编译。安装的时候一定要选择language C++。如果CUDA版本低于11.7，需要安装CUB。下载pytorch3d源码。

2024-02-22 11:29:38 748 1

原创 App ICP备案获取iOS和Android的公钥和证书指纹

依照《工业和信息化部关于开展移动互联网应用程序备案工作的通知》，向iOS和安卓平台提交App时需要先提交ICP备案信息。

2024-02-02 11:15:29 1971

原创 Git提交大文件报错“remote: Please remove the file from history and try again. ”

如在使用Git过程中不小心将较大的二进制文件加入仓库，那么仓库大小很快就会超过规定的配额，在Push的时候会报下面的错误：按照提示输入命令查看存储库中的大文件改写历史，去除大文件

2024-01-22 18:51:47 1009

原创 cocoapods 常用命令

删除本地xxx spec库(可以是cocoapods的master库,删除之后,使用pod set up安装;把自己的xxx.podspec文件推送到cocoapods 的spec仓库。执行pod install 但不升级本地cocoapods spec库。执行pod update 但不升级本地cocoapods spec库。在你的工程目录下执行之后,工程目录之下会多一个podfile文件;在工程第一次使用或者中间有添加,删除,更新库的时候使用。更新所有pod 库到podfile指定的最新版本。

2024-01-22 14:51:40 885

原创 UE5 Windows打包时报错“SDK Not Found”解决方案

在Unreal Engine 5.0.3 Windows平台下打包时报错：“Windows的SDK未正常安装，而其是生成数据的必需项。请检查主工具栏中“启动“菜单SDK部分来更新SDK。

2024-01-21 15:17:36 1784

原创 Docker设置获取环境变量

在构建Docker镜像时，可以在Dockerfile中使用ENV指令来设置环境变量。可以在docker-compose.yml中设置环境变量。使用docker run命令在运行容器时设置环境变量。使用docker inspect命令查看。使用docker exec命令查看。指令用于设置环境变量，语法为。选项用于设置环境变量，语法为。添加完后执行下面命令生效。

2024-01-18 19:20:06 1579