AI
文章平均质量分 82
嘟嘟实验室
AIGC、Unity、Unreal
展开
-
Linly-Dubbing,一键视频多语言AI配音,视频翻译,字幕生成,人声分离,自动下载视频(WIN/MAC)
Linly-Dubbing本地部署问题总结以及整合包分享原创 2024-09-02 09:44:22 · 1225 阅读 · 0 评论 -
LivePortraitV3,支持图像驱动和区域控制,更精确的人像控制(WIN,MAC)
又又又又又又更新了!原创 2024-08-29 13:20:10 · 1064 阅读 · 0 评论 -
GPT-SovitsV2,支持多语种,多音字优化,更好的音色,ZeroShot(WIN/MAC)
GPTSOVITSv2版本原创 2024-08-26 12:49:33 · 1521 阅读 · 0 评论 -
FunClip,音视频识别,自动化剪辑,文本校对,智能纠错,导出SRT
一个练手的项目,简单的增加了校对功能。原创 2024-08-19 09:59:47 · 1294 阅读 · 0 评论 -
MimicBrush,图像编辑,纹理迁移,xformers加速,MPS支持(WIN、MAC)
一键图像编辑/迁移原创 2024-08-09 14:10:01 · 310 阅读 · 0 评论 -
EasyAnimateV3,文生视频,图生视频,长视频生成
大家好啊!前段时间大火的可灵相信大家有了解过,当时需要申请内测资格,我苦苦等了2周才用上,体验后效果确实非常惊艳。不幸前段时间可灵收费了....这......于是我又发现了一个类似的项目——EasyAnimate。EasyAnimate是基于Transformer架构的文生/图生视频的项目,该项目目前已经是v3版本啦,支持生成不同分辨率尺寸,不同帧率的视频,新增了长视频模式。我也在网上看到有很多说这个是可灵的平替,那至于说效果到底有没有可灵那么好,是不是平替,大家可以自己体验下。原创 2024-08-02 21:58:52 · 759 阅读 · 0 评论 -
EchoMimicV2,Audio Driven加速模型,推理速度大幅提升
EchoMimicV2如何修改acc加速,V2版本整合包已发布。原创 2024-07-28 16:29:43 · 598 阅读 · 0 评论 -
LivePortrait优化版,表情迁移,数字人,视频驱动视频v2v(WIN,MAC)
由快手、中国科学技术大学和复旦大学联合团队开发的表情迁移项目——LivePortrait。原创 2024-07-27 12:27:59 · 951 阅读 · 0 评论 -
一键音频驱动图片数字人项目——EchoMimic(附整合包)
阿里出品数字人相关项目——EchoMimic。整合包已发布!原创 2024-07-24 07:56:12 · 2562 阅读 · 3 评论 -
【从零开始】基于AI大模型的微信聊天机器人实现-COZE
从零开始打造你的专属微信AI聊天机器人!原创 2024-07-22 17:40:18 · 2738 阅读 · 20 评论 -
Paints-UNDO优化版,模拟从0-1的绘画过程
哟呼!好久不见。本期给大家介绍一个图片转视频的项目。比较有意思的是它可以生成某张图像的从0到最终的绘画过程。例如上传一张图像。就可以生成该图像从白纸、线稿、填色、最终的图像这个过程。还可以提取关键帧。原创 2024-07-21 18:52:09 · 1011 阅读 · 0 评论 -
基于chatgpt-on-wechat搭建个人知识库微信群聊机器人
啊,最近在别人微信群里看到一个聊天机器人,感觉挺好玩的。之前GPT刚出来的时候就知道有人把聊天机器人接入到微信或者QQ中来增加互动,但是当时没想那个想法。很久没关注这块了,发现现在可以使用大模型+知识库的方式来打造自己的专属机器人。我突然眼前一亮,我现在特别需要这个机器人。会有很多新加入的群友,需要发送一些群规和欢迎语。大家有时会问很多基础的重复性的问题。我希望的自动发送群规和欢迎语这个普通的群聊机器人都具备,这个不是刚需。原创 2024-06-22 10:13:53 · 2722 阅读 · 4 评论 -
ChatTTS增强版V3【已开源】,长文本修复,中英混读,导入音色,批量SRT、TXT
最近有点忙,拖了2周左右。看到后台有很多朋友的想法和建议,很不错,但是精力有限,实在不能保证把大家的想法都更上去,后面抽时间慢慢更。把项目代码开源了,希望对大家有帮助,有能力的也可以自行修改。本项目开源地址:https://github.com/CCmahua/ChatTTS-Enhanced制作不易,如果本文对您有帮助,还请点个免费的赞或在看!原创 2024-06-22 10:12:48 · 4130 阅读 · 4 评论 -
ChatTTS增强版V2,批量导出srt,语速控制,情感控制,支持朗读数字,问题修复
新增SRT导出、多文本批量、语速控制、情感控制等功能。修复停顿、数字等问题。原创 2024-06-08 19:24:36 · 2850 阅读 · 2 评论 -
ChatTTS增强版,增强音质、批量处理、固定音色、支持长文本
基于最近火热的 ChatTTS项目制作的增强版,支持音频增强、批量、长文本生成、音色固定等功能。原创 2024-06-04 09:47:42 · 4229 阅读 · 0 评论 -
AI换脸FaceFusion一键云部署指南
保姆级一键云端部署FaceFusion项目。原创 2024-05-31 20:32:53 · 2430 阅读 · 1 评论 -
AI换脸FaceFusion2.6.0版本更新,新增帧增强模型!优化执行问题!
FaceFusion更更更更更更新啦!本次更新我将不同平台的版本都统一化,安装更加简单方便。先来看看本次更新了什么内容:结合更新内容,说说我使用下来的问题第一条更新增加了2个画面增强的模型,试下来部分情况的处理还不错,默认的最稳妥,你可以试着用其他的增强模型看看不同的处理效果。第二、三、四条是针对开发的,对影响体验不大,程序默认会打开浏览器,选择处理设备也可以在网页中进行选择。第五条新增支持英特尔的显卡。第六条,这里是增加了一个限制,之前也有很多朋友问过我,过大的视频会导致最后合成的时候卡死,一直等着出不来原创 2024-05-23 10:11:34 · 4032 阅读 · 10 评论 -
混元DiT文生图大模型本地离线体验
前段时间腾讯的混元大模型开源了,据说是具备双语生成能力,对中国元素的理解能力非常强,于是带着好奇心花了点时间部署在本地跑了下看看。原创 2024-05-21 23:24:30 · 642 阅读 · 0 评论 -
PuLID——自由风格换脸转绘
PuLID——人物一致性风格转绘webui离线整合包原创 2024-05-19 14:32:16 · 1154 阅读 · 0 评论 -
IC-Light一键实现AI图片光影控制
这是一个专注于图像照明控制和光影重构的AI项目。原创 2024-05-10 08:30:36 · 1276 阅读 · 0 评论 -
8G显存玩转AI换衣IDM-VTON(支持MAC、WIN)
最近AI换衣项目IDM-VTON挺火哈,我也火速体验了一把。效果也是很不错,相对OOTDiffusion的换衣效果提升了不少。那部署的时候遇到比较大的问题是高显存占用!太吃配置了!24G的显卡占用了18G左右。于是花了点时间改成使用了低精度模型进行加载(多个版本,下文有介绍),并且支持MAC系统,现在只需要最低8G显存,就能运行这个项目啦!原创 2024-05-09 08:32:55 · 1372 阅读 · 1 评论 -
【AI图生视频】Muse离线本地图片转动态视频教程
今天给大家介绍一个图片转视频的项目,这个项目包含了两部分,第一部分是根据输入的文本和图像生成视频,第二部分就是根据输入的图像和参考视频生成新的视频。原创 2024-04-30 08:30:00 · 644 阅读 · 0 评论 -
【AI图像】一键图像风格迁移——InstantStyle
今天我要介绍一个很有意思的AI项目,它可以实现图像风格迁移。只需提供一张参考图,就可以让任何图像按照这个参考图的风格进行渲染。原创 2024-04-29 00:21:21 · 1241 阅读 · 0 评论 -
【AI数字人】AniPortrait音频驱动图片数字人本地离线整合包
今天分享的项目是由华为和腾讯的研究人员联手开发的AniPortrait,只需一段音频和一个静态的肖像图像,就能生成一段数字人视频。支持音频生成视频、视频生成视频。我已经将项目打包,离线解压即可使用!(整合包在文章末尾自取)原创 2024-04-29 00:16:05 · 1704 阅读 · 4 评论 -
【AI声音克隆】OpenVoice简单易上手的语音克隆整合包
大家好,之前有朋友反馈说GPT-Sovits有些难上手,操作比较复杂,问我有没有比较简单的工具,今天给大家分享的语音克隆工具操作非常简单,可商用!(整合包在文章末尾自取)原创 2024-04-20 10:10:47 · 1122 阅读 · 0 评论 -
DiffBIR一键图片/老照片高清修复!支持CPU、GPU!
今天我要向大家分享的是一款照片修复工具——DiffBIR,它能够解决照片模糊和老照片细节丢失的问题。这款工具运用了AI照片修复模型,不仅能够去除模糊,还能让老照片的细节变得丰富饱满。(整合包在文章末尾自取)修复效果。原创 2024-04-16 18:00:23 · 1667 阅读 · 8 评论 -
MuseTalk简单易用!腾讯出品!离线口型同步数字人工具!
嗨!大家好!今天分享一款数字人工具!MuseTalk,它是腾讯团队开发的一个实时高质量音频驱动的口型同步模型。支持中文、英文、日文、等多语言的音频。我已经将项目打包成整合包,解压即可使用!(整合包在文章末尾自取)原创 2024-04-16 18:00:20 · 2723 阅读 · 6 评论 -
InStantID一键生成你的专属数字写真(附整合包)
今天给大家分享一款AI艺术写真制作工具。上传一张照片,一键生成多种风格的高清写真照片,支持微调,本地离线运行。这是我上传的原图。生成的效果↓。原创 2024-04-05 16:18:49 · 593 阅读 · 1 评论 -
Easy_Wav2ip离线一键批量数字人制作(附教程)
Easy_Wav2ip离线一键批量数字人制作原创 2024-03-31 18:27:15 · 1490 阅读 · 2 评论 -
FaceFusion常见问题
如果都没有,那么是视频元数据的问题,换个视频试下。如果非要用指定视频,将视频放到剪映中重新导出mp4再进入facefusion换脸。当你的系统名不是中文,但是遇到了这个问题,检查下你的图片/视频的名字是不是有中文。将解压后的文件夹删除,下载BandiZip解压软件重新解压。出现这个问题,首先排除下是不是你上传的图片或者视频文件名中有中文!解决方法:图片/视频路径或者文件名改名。根据这篇文章修改下C盘的文件夹名。这是由于系统名是中文导致的。图片和视频路径中是否有中文!通常发生在视频处理完成后。原创 2024-03-30 10:10:02 · 3134 阅读 · 2 评论 -
离线一键图片转3D模型!6G显存,快速建模!
只需一张图片就可以一键生成3D模型!今天给大家分享一个好玩的项目——TripoSR。项目特点是非常快速的生成3D模型。原创 2024-03-24 11:35:24 · 1208 阅读 · 1 评论 -
一键虚拟换衣项目OOTDiffusion整合包发布
今天给大家分享个一键虚拟换装的项目。我们只需要上传模特图和服饰图就可以实现一键换装。我为大家准备了整合包和使用教程。原创 2024-03-14 13:57:06 · 2889 阅读 · 2 评论 -
AI换脸——FaceFusion最新使用指南(附一键整合包)
大家好,今天给大家分享一款换脸工具——FaceFusion,这款工具相对,增加了很多模型和高清算法,大大提高了图片和视频的换脸效果。同时还增加了三种遮罩功能,解决了脸部有物体遮挡时融合效果差和跳闪的问题。首先介绍如何在本地安装,然后演示最常用的换脸流程和设置。第三部分详细介绍遮罩功能,并演示不同遮罩的用法。原创 2024-02-14 09:30:00 · 32694 阅读 · 40 评论