- 博客(23)
- 收藏
- 关注
原创 新一代AI换脸更自然,DeepLiveCam下载介绍(可直播)
DeepLiveCam是一款基于人工智能的图片替换工具,专注于提供实时人脸交换和一键视频深度伪造(deepfake)技术,能通过使用单张图片,在视频或直播中实现高精度的人脸替换。该工具功能齐全、操作简单,UI设计清晰明了,它不仅允许用户对替换后的面部特征进行自定义调整(包括肤色、光线、表情等参数支持修改)还内置多种风格的滤镜和特效,满足了用户个性化需求。多人处理:能够处理同一图像或视频中的多张人脸,不仅限于单人换脸。多维换脸:可以通过一张图片,来进行图片、视频以及直播换脸。Many faces:多人换脸。
2024-11-08 21:44:09 495
原创 最逼真的AI换脸软件,Pluse下载介绍(可直播)
Pluse是基于人工智能的实时AI换脸工具,可以在无需任何前期数据训练的情况下,通过一张照片快速替换视频中的人脸,它支持高分辨率细节重建、色彩矫正,并能实时替换多目标人脸,非常适合娱乐社交、影视制作和虚拟现实等多种应用场景。Pluse不仅操作简单,还具备高保真度和实时性,效果十分惊艳,特别适合对电脑技术没什么研究的新手,只需简单几步,就能完成换脸操作,不仅支持视频换脸,还可以直播换脸。稍等一下,即可看到换脸后生成的视频,视频默认保存在项目路径的data文件夹下,也可以在Output界面右上角下载。
2024-11-01 20:45:55 450
原创 AI老照片修复神器,Anole下载介绍
Anole基于深度学习算法分析功能,可以生成更加清晰和自然的放大效果,重建高频信息减少模糊和失真,在处理图像的过程中,能够保留更多细节和像素信息,极大的提高了修复质量。最近AI老照片修复上色,再一次火出圈,一些社交平台关于此话题内容流量满满,尤其是在小红书和抖音火的不得了,本期文章就来给大家分享下AI修复老照片的方式方法。空间大、速度快、安全稳固,支持教育网加速,支持手机端。本文主要介绍使用Anole修复老照片的方法,只需输入一张黑白或彩色照片,即可得到修复后的彩色结果,让往日的老照片坐上时光机重焕新生。
2024-09-15 20:04:26 359
原创 真人模特失业?AI虚拟试衣一键成图,IDM-VTON下载介绍
IDM-VTON是一个AI虚拟换装工具,旨在帮助服装商家解决约拍模特导致的高昂成本问题,只需一张服装图片,就可以生成各种身穿该服装的模特,大大简化了传统的产品展示过程。IDM-VTON采用了先进的图像识别和视觉检测算法,在用户上传服装图片和模特姿势图后,能在短时间内生成多张商业用级的照片,在操作界面可以直观地看到服装的实际穿着效果。IDM-VTON为服装商家提供了一个创新的解决方案,不仅节省了场地、拍摄、后期等费用,在降低成本的同时,还加速了新服装上市的效率,提高了商品的竞争力。
2024-09-07 12:35:42 616
原创 最新AI生成视频工具!效果不输快手可灵,CogVideoX下载介绍
要说AI生成视频最火的项目,当属国产的快手可灵了,甚至比OpenAI的Sora还要火,前者还是个ppt,可灵已经在落地公测了,博主在前段时间申请试用通道的时候,竟然排到几十万人开外的位置,好在最后还是拿到了使用资格,还没用上的外国友人只能干着急,在社交媒体发「求求了!用户只需输入一段文字,就能快速生成充满想象力的视频,还可以自由选择生成的视频风格,包括卡通、3D、黑白、油画、电影等,并配上软件自带的音乐。1.点击软件界面右下角的load按钮,选择项目自带的workflow.json文件并加载。
2024-08-16 20:28:37 652
原创 Diffutoon下载介绍:真人视频转动漫工具,轻松获得上千点赞
Diffutoon的核心是基于深度学习的图像转换模型,这些模型经过大量的动漫图像和视频数据训练,能够识别并模仿动漫风格的特征,包括颜色、线条、阴影和纹理等。本期给大家介绍一款AI转绘工具Diffutoon,可以将逼真的视频转换成动画风格,不仅能够处理高分辨率和快速运动的视频,还能确保整个视频的风格保持一致。· 超分辨率:采用专门的控制网络进行视频的上色处理,即使输入低分辨率的视频,也能够生成高质量的动漫风格视频。5.设置开始帧0,结束帧设为视频的秒数乘以30,例如10秒视频的结束帧就是300。
2024-07-27 16:29:49 717
原创 最强AI语音克隆和文本配音工具!与真人无异,CosyVoice下载介绍
CosyVoice采用了总共超15万小时的数据训练,依托先进的大模型技术进行特征提取,从而完成声音的复刻,用户无需训练过程,仅需提供时长较短的音频,即可迅速生成高度相似且听感自然的定制声音。CosyVoice是一个大规模预训练语言模型,深度融合文本理解和语音生成的一项新型语音合成技术,能够精准解析并诠释各类文本内容,将其转化为宛如真人般的自然语音。空间大、速度快、安全稳固,支持教育网加速,支持手机端。教育场景:使用复刻老师的声音,加强师生互动,丰富教学视频和课件的内容,打造更亲切、更生动的学习体验。
2024-07-20 13:13:24 877
原创 川普真会说中文?连嘴型都同步,VideoReTalking AI数字人下载介绍
你只需要传入一个视频文件和音频文件,它会生成一个新的视频,在这个视频里,不仅人物的嘴型会与音频同步,就连表情也会随着声音的起伏发生变化,而整个过程都在没有用户干预的情况下按顺序处理。百度网盘为您提供文件的网络备份、同步和分享服务。1、表情引导:给定一个会说话的头像视频,使用表情编辑网络根据相同的表情模板修改每一帧的表情,从而生成具有规范表情的视频。2、口型同步:将规范表情视频与给定的音频一起输入口型同步网络以生成口型同步视频。1、在下载资源的根目录找到examples\face文件夹,选择其中的视频文件。
2024-06-29 14:55:14 530
原创 CodeFormer一款既能图像修复、还能视频增强去码的AI软件(下载介绍)
它可以处理视频中的各种问题,如模糊、抖动、颜色失真等,从而提供更清晰、更稳定的视频观看体验。CodeFormer通过分析视频的每一帧,对图像进行逐一修复,使得修复后的视频在细节和色彩上都更接近原始状态。由于其专为处理人脸设计,CodeFormer在人脸修复方面表现尤其出色,它可以处理各种复杂的人脸图像,从模糊到损坏,都能通过CodeFormer恢复到接近原始状态的清晰度和色彩。2、采用了预训练VQGAN离散码本空间的方法,将人脸复原任务转成Code序列的预测任务,大幅度降低了复原任务映射的不确定性。
2024-06-29 13:15:57 1128
原创 VALL-EX下载介绍:只需3秒录音,即可克隆你的声音
VALL-EX是一个强大和创新的多语言文本转语音模型,支持对中文、英文和日语的语音进行合成和克隆,使用者只需上传一段3-10秒的录音,就可以生成高质量的目标音频,同时保留了说话人的声音、情感和声学环境。VALL-EX的应用范围非常广泛,可以用于跨语言文本到语音、语音合成和语音到语音翻译等各种任务,无论是商业用途还是个人使用,VALL-EX都可以帮助用户轻松地进行跨语言交流和文本转语音任务。生成的声音是基于上传的语音文件训练所得,建议多生成几次,选择效果最好的使用。3.输入待合成语音的文本内容。
2024-06-01 11:56:55 521
原创 最好用的AI换脸软件,rope下载介绍(支持cpu)
这得益于机器学习技术的不断发展,rope经过深度神经网络的无数次迭代优化,最终得出的模型可以自动学习和识别视频中的人脸特征,它可以在不损害原视频质量的情况下实现人脸的替换,而且还可以处理各种面部表情和动作,使效果更加逼真(PS:一个人脸还不够?耐心等待一段时间,视频就生成好啦,生成效率与视频长度和GPU算力有关,这里推荐GTX1060以上显卡和同等级的A卡,集成显卡也能使用。相比于挂载了各种控件、琐碎杂乱,甚至需要频繁调参的换脸软件,rope的操作界面简洁明了,不懂代码的小白也能轻松上手。
2024-05-02 13:11:09 2622 1
原创 最简单的AI换脸软件,roop下载介绍(可直播)
它最强大的地方就在于对人物表情的精准捕捉,虽说rope也能通过调整嘴唇和遮罩层高度来拟合原始人脸的神态,但roop使用起来更简单,把“换多张脸”选项打开后,点击“直播”按钮就可以实时换脸。· 保持帧率:原视频是多少帧率,合成后的视频就是多少帧率,最好启用这个参数,否则可能出现帧数不稳定的情况。此外,roop还自带预览功能,界面打开后,键盘的“↑↓”键可以切换需要替换的人脸,“←→”键是拖动进度条。设置完选项,点击“开始”按钮,在控制台中可以查看当前的处理进度,程序执行完毕会输出“成功”字样。
2024-04-24 21:29:42 1539
原创 P图神器Lama下载介绍,一键移除图片中任何不想要的元素
在以前,我们想将图片中的文字、水印去除,可以使用ps,但ps的学习成本比较高,没有那么容易上手,在面对复杂的几何结构和高分辨率图像时,ps的处理效果也不是很理想,造成这种情况的主要原因是传统的图像修复系统在构造图像网络和损失函数的过程中缺乏有效的感知视野,为了解决这个问题,Lama提供了一种新的方法,称为大型掩模修复。Lama的修复网络在一系列数据集上提高到了最先进的水平,即使在复杂的场景中也能获得出色的性能,Lama可以处理超高分辨率的图像,并且在竞争基线中以更低的参数和计算成本实现了这一点。
2024-03-30 12:06:04 652 1
原创 动态水印也能去除?ProPainter一键视频抠图整合包下载
4、使用掩码引导的稀疏Transformer块对传播的特征进行精细调整,并采用仅考虑特定子集的稀疏策略,提高算法的效率,减少内存消耗,同时保持高性能水平。4、上一步完成后,点击“去水印”按钮,等待一段时间即可得到最终的结果,最后生成的视频会保存在项目路径的output文件夹下。2、在右侧的区域里,点击需要移除的物体,有时需要多点几次,尽可能让移除的对象被完整识别,如果识别错误,可以点击“撤销”对象补全:填补视频中缺失的区域,通常用于修复受损的视频帧或损坏的部分,使其看起来完整和连贯。
2024-03-23 11:12:19 961 1
原创 人人都是艺术家!AI工具Doodly让潦草手绘变精美画作
手绘一个机器人草图,辅以prompt提示「photo, photorealistic CG rendering of a robot head, predator, downtown city bokeh at night, dramatic lighting(照片,机器人头部逼真的CG渲染,铁血战士,虚化的城市夜景,戏剧光效)」,就能得到城市夜景下炫酷的机器人战士。以上都是由AI脑补出来的场景,Doodly也支持文本prompt的输入方式,由涂鸦+提示词创作的结果,更贴近于我们心中想要的答案。
2024-03-16 13:09:27 600 1
原创 照片也能说话了?嘴型表情全同步,AI数字人时代要来了
SadTalker是一款先进的人工智能模型,它通过从音频中学习生成3D运动系数,并使用全新的三维面部渲染器来生成头部运动,只需传入一张照片和一段音频,就能生成高质量的AI数字人视频。SadTalker生成后的人物头部运动规律,面部表情自然,口型也和音频的内容保持一致(小姐姐还会眨眼睛!4、使用生成的三维运动系数映射到人脸渲染的无监督三维关键点空间,合成最终视频。· 生成中的批量大小:生成视频的速度,默认1,显卡好可以适当拉大。2、通过蒸馏系数和3D渲染的脸部,从音频中学习准确的面部表情。
2024-03-09 13:02:59 742 1
原创 ChatGPT要慌了?谷歌推出最新AI大模型Gemma(可本地部署)
无论是国外的ChatGPT或者国内的“文心一言”,其服务都是以API接口的形式提供,用户在使用的过程中可能会遇到网络拥堵问题以及隐私泄露的风险,而Gemma则是本地部署,服务仅限单人使用,这种方式既提升了人机交互的频率,也不用担心个人信息被外界获取。2月21日,谷歌发布了最新一代语言大模型Gemma,与之前的Gemini模型相比,Gemma将参数扩展到了惊人的6万亿个,和ChatGPT4相当。Gemma使用起来非常简单,输入提示语,点击提交,回答的速度相当快~①项目安装路径不要包含中文。
2024-03-02 21:38:03 585
原创 一秒出图?SDXL-Turbo实时AI绘画整合包下载
SDXL Turbo是一种快速生成的AI构图模型,它基于一种称为对抗性扩散蒸馏的新训练方法,该方法允许在1到4个步骤中以高图像质量对大规模基础图像扩散模型进行采样,并将其与对抗性损失相结合,以确保即使在一个或两个采样步骤的低阶模式下也能获得高图像保真度。博主GTX2070的显卡,使用Stable Diffuison需要一分多钟才可出图,SDXL Turbo10秒左右就搞定了。简单说,就是快速成图的同时质量上却不打折扣,SDXL Turbo有多快?2.图生图:上传本地图片,输入提示词,点击Generate。
2024-02-25 18:49:42 758 1
原创 AI抠图神器RMBG下载介绍
RMBG是一款先进的AI抠图工具,和其它同类型软件不同的是,RMBG不需要人工勾勒图形轮廓,可以自动识别图像的前景并去除背景,节省大量时间,效果非常惊艳。RMBG迭代消耗了数万张高质量、高分辨率、手动标记、高像素精度、完全授权的图像,它的准确性、效率和多功能性可以与市面上领先的商业产品相媲美(无次数限制)RMBG的模型是在精心选择的数据集上训练的,包括各种日常图像、电子商务、游戏和广告内容,适用于推动企业创建大规模的商业用例。RMBG使用起来非常简单,只需要上传一张图片,提交等待,3秒内就能输出结果。
2024-02-17 16:58:13 666 1
原创 CodeFormer一款既能人脸修复、还能视频去码的AI软件,附下载使用教程
它可以处理视频中的各种问题,如模糊、抖动、颜色失真等,从而提供更清晰、更稳定的视频观看体验。CodeFormer通过分析视频的每一帧,对图像进行逐一修复,使得修复后的视频在细节和色彩上都更接近原始状态。由于其专为处理人脸设计,CodeFormer在人脸修复方面表现尤其出色,它可以处理各种复杂的人脸图像,从模糊到损坏,都能通过CodeFormer恢复到接近原始状态的清晰度和色彩。2、采用了预训练VQGAN离散码本空间的方法,将人脸复原任务转成Code序列的预测任务,大幅度降低了复原任务映射的不确定性。
2024-01-17 11:03:51 8803
原创 川普真会说中文?连嘴型都同步,用VideoReTalking一键生成你的AI播报员
你只需要传入一个视频文件和音频文件,它会生成一个新的视频,在这个视频里,不仅人物的嘴型会与音频同步,就连表情也会随着声音的起伏发生变化,而整个过程都在没有用户干预的情况下按顺序处理。百度网盘为您提供文件的网络备份、同步和分享服务。1、表情引导:给定一个会说话的头像视频,使用表情编辑网络根据相同的表情模板修改每一帧的表情,从而生成具有规范表情的视频。2、口型同步:将规范表情视频与给定的音频一起输入口型同步网络以生成口型同步视频。1、在下载资源的根目录找到examples\face文件夹,选择其中的视频文件。
2024-01-04 15:40:37 839 1
原创 98秒转录2.5小时音频,最强音频转文字软件insanely-fast-whisper下载部署
Whisper-Large-v3:OpenAI推出的一种用于自动语音识别(ASR)和语音翻译的预训练模型,经过168万小时的标记数据训练,显示出强大的能力,可以在不需要微调的情况下推广到许多数据集和领域。6、选择处理速度,这个值并不是越大越好,博主GTX1660的显卡设置成1最为合适,配置好可以适当调大。4、选择音频语言,程序会识别语言也可以手动选择语言,选择与音频不同的语言,生成的结果是选择后的语言。7、记录音频形式,按词或片段记录音频,根据自己的需要选择,文件末尾会输出完整的文本。
2023-12-27 23:59:47 739
原创 最简单的AI绘画软件,roop下载分享(可直播)
它最强大的地方就在于对人物表情的精准捕捉,虽说rope也能通过调整嘴唇和遮罩层高度来拟合原始人物的神态,但roop使用起来更简单。此外,roop还自带预览功能,界面打开后,键盘的“↑↓”键可以切换需要替换的目标,“←→”键是拖动进度条。保持帧率:原视频是多少帧率,合成后的视频就是多少帧率,最好启用这个参数,否则可能出现帧数不稳定的情况。设置完选项,点击“开始”按钮,在控制台中可以查看当前的处理进度,程序执行完毕会输出“成功”字样。PS:最近天气是越来越冷了,北方的朋友注意保暖,南方的朋友应该也要多穿点😎?
2023-12-17 23:31:59 978 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人