自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(589)
  • 资源 (3)
  • 收藏
  • 关注

原创 Stable Diffusion WebUI 更换图片背景

Rembg是一个用于去除图像背景的开源工具,能够智能地识别和分离图片中的主体与背景,生成高质量的抠图效果。

2024-05-19 23:45:02 317

原创 Stable Diffusion WebUI使用inpaint anything插件实现图片局部重绘

Inpaint Anything是一个强大的图像处理工具,它结合了SAM(Segment Anything Model)、图像修补模型(如LaMa)和AIGC模型(如Stable Diffusion)等先进技术,以实现图像中物体的移除、内容的填补以及场景的替换。无论是对图像中的任何元素进行编辑,还是对图像整体进行场景转换,Inpaint Anything都能胜任。

2024-05-17 00:32:44 857

原创 解决报错:“ERROR: failed to solve: cannot replace to directory /var/lib/docker/overlay2/……”

执行 docker build 命令时报了如下错误:删除node_modules目录 修改.dockerignore,把app/node_modules添加到app/node_modules中

2024-05-16 13:07:21 164

原创 使用AudioCraft(MusicGen)生成音乐

模型将根据提供的描述生成一段简短的音乐,一次可生成长达30秒的音频。模型是根据库存音乐目录中的描述进行训练的,最有效的描述应该包括现有乐器的一些细节,以及一些预期的用例(例如,添加“perfect for a commercial”可能会有所帮助)。facebook/musicgen-melody:以文本和旋律为条件的音乐生成模型,也可以只使用文本。facebook/musicken-small:以文本为条件的300M转换器解码器。

2024-05-10 15:56:17 345

原创 清理 Conda 和 pip 缓存

查看 Conda 缓存的使用情况。查看 cache 列表和路径。删除不再使用的包和缓存。

2024-04-29 11:19:16 985

原创 Stable Diffusion使用ControlNet:IP-Adapter实现图片风格迁移

IP-Adapter 全称是 Text Compatible Image Prompt Adapter for Text-to-Image Diffusion Models(文本到图像扩散模型的文本兼容图像提示适配器),是腾讯研究院出品的一个新的ControlNet模型,旨在使预训练的文本到图像扩散模型能够生成具有图像提示的图像。IP-Adapter是一种有效的轻量级适配器,用于实现预训练文本到图像扩散模型的图像提示能力。

2024-04-27 18:15:24 694

原创 Stable Diffusion常用提示词(Prompt)

Stable Diffusion常用提示词

2024-04-27 11:47:27 1235

原创 Stable Diffusion 常用放大算法详解

常规用法:先在低分辨率下反复画图,确定一个比较满意的图像时,再借助固定随机种子,来进行高清修复,得到分辨率更高的图像。高清修复有时候会修改图像,增加不必要的元素,可以通过调整重绘幅度进行抑制。如果只是想放大图片,可以设置为(0.3-0.5),如果想要AI自由发挥,可以设置更高的重绘幅度。

2024-04-26 16:30:41 1694 1

原创 Topaz Video AI参数详解

Topaz Video AI是一款由Topaz Labs开发的人工智能视频处理软件。这款软件利用先进的深度学习技术,为视频处理提供了多种高效、智能的工具,帮助用户快速、轻松地完成视频处理任务。

2024-04-26 00:40:18 809

原创 使用IOPaint实现图片擦除路人

IOPaint 是一个免费的开源的 inpainting/outpainting 工具,由最先进的 AI 模型提供支持。

2024-04-24 21:09:18 702

原创 使用IPEX-LLM加速大语音模型LLM

IPEX-LLM是一个用于在英特尔CPU和GPU(如本地PC的iGPU、独立显卡如Arc、Flex和Max)上加速本地LLM推理和微调的PyTorch库。

2024-04-22 11:27:59 395

原创 python使用Flask框架开发API

Flask是一个基于Python的轻量级Web应用程序框架。

2024-04-11 11:44:35 419

原创 在Win11上部署大模型推理加速工具vLLM

vLLM是伯克利大学LMSYS组织开源的大语言模型高速推理框架,旨在极大地提升实时场景下的语言模型服务的吞吐与内存使用效率。vLLM是一个快速且易于使用的库,用于 LLM 推理和服务,可以和HuggingFace 无缝集成。vLLM利用了全新的注意力算法PagedAttention,有效地管理注意力键和值。在吞吐量方面,vLLM的性能比HuggingFace Transformers(HF)高出 24 倍,文本生成推理(TGI)高出3.5倍。

2024-04-08 10:50:46 1147 1

原创 Python实现WebSocket通信

WebSocket是一种在单个TCP连接上进行全双工通信的协议,位于 OSI 模型的应用层。与传统的HTTP请求-响应模型不同,WebSocket的最大特点就是,服务器可以主动向客户端推送信息,客户端也可以主动向服务器发送信息,实现实时性和互动性。

2024-03-25 15:39:33 944

原创 使用GPT将文档生成问答对

根据文档生成问题列表。根据问题列表生成问答对。

2024-03-25 14:43:17 830

原创 部署DiffSynth-Studio实现视频风格转换

DiffSynth 是一个新的 Diffusion 引擎,可以实现图片和视频的风格转换。

2024-03-21 10:35:41 923

原创 使用Docker安装detectron2

Detectron2 官网安装教程是基于 linux 安装的,在 windows 上直接安装有很多问题,下面采用 docker 方式在 windows 上安装。Detectron2 是一个用于目标检测、分割和其他视觉识别任务的平台。安装Miniconda3。安装detectron2。拉取cuda116镜像。

2024-03-19 20:19:47 282

原创 部署高斯喷射项目gaussian-splatting

硬件要求支持 CUDA 的 GPU,具有 7.0+ 的计算能力24 GB VRAM软件要求Conda用于 PyTorch 扩展的 C++ 编译器(Visual Studio 2019)

2024-03-18 16:45:36 550

原创 UE5 android打包

Android SDK Command-line Tools,选择Android SDK Command-line Tools (latest)修改包名、数据打包到APK,并禁用验证OBB,继续下拉,找到红色的警告,点击立即配置,自动设置项目以写入必需平台文件。Android SDK Build-Tools 35-rc1,选择30相关内容。进入 Unreal Engine,在菜单中选择“编辑”->“项目设置”选择“平台”->“Android”->“打包项目”选择“平台”->“刷新平台状态”

2024-03-14 19:43:20 1202

原创 docker run带 --gpus all 参数报错:“Auto-detected mode as ‘legacy‘ nvidia-container-cli: mount error”

启动“docker run --gpus all ...”时报错:该镜像是在Ubuntu环境下创建的,而在WSL下使用nvidia-docker启动该镜像时会报错。1. 使用docker而不是nvidia-docker启动原始镜像下的容器(去掉--gpus all)2、在该容器中删除 /usr/lib/x86_64-linux-gnu/libnvidia-ml.so.1 和文件 /usr/lib/x86_64-linux-gnu/libcuda.so.13、新开一个终端,把此时的容器打包为镜像

2024-03-11 15:25:25 1174

原创 Python调用XTTS实现声音克隆+文字转语言

XTTS 是一个语音生成模型,不需要过多的训练数据,仅使用一个 6 秒的音频文件即可将语音克隆为不同的语言。XTTS-v2 支持 17 种语言:英语 (en)、西班牙语 (es)、法语 (fr)、德语 (de)、意大利语 (it)、葡萄牙语 (pt)、 波兰语 (pl)、土耳其语 (tr)、俄语 (ru)、荷兰语 (nl)、捷克语 (cs)、阿拉伯语 (ar)、中文 (zh-cn)、日语 (ja)、匈牙利语 (hu)、韩语 (ko) 印地语(hi)

2024-03-11 11:49:01 1001

原创 Python调用edge-tts实现在线文字转语音

edge-tts是一个 Python 模块,允许通过Python代码或命令的方式使用 Microsoft Edge 的在线文本转语音服务。

2024-03-06 20:20:13 2934

原创 ER-NeRF实时对话数字人模型训练与部署

ER-NeRF是基于NeRF用于生成数字人的方法,可以达到实时生成的效果。

2024-03-03 16:02:57 1899 2

原创 Python调用pyttsx3实现离线文字转语音

pyttsx3是 Python 中的文本到语音的离线转换库。带默认选项的朗读功能的单行用法。

2024-03-01 18:51:48 730

原创 解决“source ~/.bashrc 无效”的问题

dockerfile 在执行 RUN source ~/.bashrc 的时候会报错:dockerfile默认的shell是sh,无法使用source在 RUN source ~/.bashrc 前面添加以下指令,将shell改为bash

2024-02-28 14:22:34 1386

原创 部署PhotoMaker通过堆叠 ID 嵌入自定义逼真的人物照片

PhotoMaker只需要一张人脸照片就可以生成不同风格的人物照片,可以快速出图,无需额外的LoRA培训。

2024-02-28 12:26:25 707

原创 Huggingface配置镜像

首先确保已经安装了huggingface_hub依赖包。

2024-02-27 20:16:09 2200

原创 部署roop实现视频人脸替换

roop只需要一张人脸的图像,就可以替换视频中的脸。不需要数据集和模型训练。

2024-02-27 20:03:27 418

原创 在Win11下安装pytorch3d

一般cl.exe的地址是在Microsoft Visual Studio***\VC\bin\amd64\里面。以管理员身份打开“x64 Native Tools Command Prompt...”安装成功后,将cl.exe的路径添加到环境变量Path中。在conda环境下,进入pytorch3d目录执行编译。安装的时候一定要选择language C++。如果CUDA版本低于11.7,需要安装CUB。下载pytorch3d源码。

2024-02-22 11:29:38 748 1

原创 App ICP备案获取iOS和Android的公钥和证书指纹

依照《工业和信息化部关于开展移动互联网应用程序备案工作的通知》,向iOS和安卓平台提交App时需要先提交ICP备案信息。

2024-02-02 11:15:29 1971

原创 Git提交大文件报错“remote: Please remove the file from history and try again. ”

如在使用Git过程中不小心将较大的二进制文件加入仓库,那么仓库大小很快就会超过规定的配额,在Push的时候会报下面的错误:按照提示输入命令查看存储库中的大文件改写历史,去除大文件

2024-01-22 18:51:47 1009

原创 cocoapods 常用命令

删除本地xxx spec库(可以是cocoapods的master库,删除之后,使用pod set up安装;把自己的xxx.podspec文件推送到cocoapods 的spec仓库。执行pod install 但不升级本地cocoapods spec库。执行pod update 但不升级本地cocoapods spec库。在你的工程目录下执行之后,工程目录之下会多一个podfile文件;在工程第一次使用或者中间有添加,删除,更新库的时候使用。更新所有pod 库到podfile指定的最新版本。

2024-01-22 14:51:40 885

原创 UE5 Windows打包时报错“SDK Not Found”解决方案

在Unreal Engine 5.0.3 Windows平台下打包时报错:“Windows的SDK未正常安装,而其是生成数据的必需项。请检查主工具栏中“启动“菜单SDK部分来更新SDK。

2024-01-21 15:17:36 1784

原创 Docker设置获取环境变量

在构建Docker镜像时,可以在Dockerfile中使用ENV指令来设置环境变量。可以在docker-compose.yml中设置环境变量。使用docker run命令在运行容器时设置环境变量。使用docker inspect命令查看。使用docker exec命令查看。指令用于设置环境变量,语法为。选项用于设置环境变量,语法为。添加完后执行下面命令生效。

2024-01-18 19:20:06 1579

原创 解决docker run报错:Error response from daemon: No command specified.

将docker镜像export/import之后,对新的镜像执行docker run时报错:查看容器的command:在docker run命令上增加sh -c command:方案2:改用save/load命令替代export/import

2024-01-10 17:03:50 1752

原创 Stable Diffusion WebUI制作光影文字效果

在huggingface上下载control_v1p_sd15_brightness模型。将模型放在stable-diffusion-webui\extensions\sd-webui-controlnet\models目录下。

2023-12-30 12:34:53 1184

原创 Stable Diffusion WebUI安装合成面部说话插件SadTalker

SadTalker可以根据一张图片、一段音频,合成面部说这段语音的视频。图片需要真人或者接近真人。

2023-12-29 23:30:44 1303

原创 iOS使用CXCallObserver监听电话接听与拨打

iOS使用CXCallObserver监听电话接听与拨打

2023-12-25 18:41:46 749

原创 使用Swift Package Manager (SPM)实现xcframework分发

Swift Package Manager (SPM) 是苹果官方提供的用于管理 Swift 项目的依赖关系和构建过程的工具。它是一个集成在 Swift 编程语言中的包管理器,用于解决在开发过程中管理和构建包依赖项的需求。

2023-12-21 18:32:59 1097

原创 iOS将framework转为xcframework

先把framework拷贝到两个文件夹下边,这里只需要armv7、arm64、x86_64。把iphonesimulator中的除模拟器之外的指令集删除。把iphoneos中的模拟器指令集删除。使用xcodebuild 进行合成。

2023-12-20 10:35:30 1256

iOS生成二维码 QRCodeView

iOS生成二维码 QRCodeView 封装完整,可以展示二维码或者生成二维码图片,使用原生滤镜CIFilter生成二维码。

2020-10-19

iOS生物识别FaceID&TouchID

iOS的指纹识别验证与面部识别验证,调用系统的LocalAuthentication.framework,封装完整。

2020-10-19

IOS环形进度条

IOS环形进度条,可自定义环形进度条的时间、半径、颜色等等。

2014-11-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除