自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

原创 Diffutoon下载介绍:真人视频转动漫工具,轻松获得上千点赞

Diffutoon的核心是基于深度学习的图像转换模型,这些模型经过大量的动漫图像和视频数据训练,能够识别并模仿动漫风格的特征,包括颜色、线条、阴影和纹理等。本期给大家介绍一款AI转绘工具Diffutoon,可以将逼真的视频转换成动画风格,不仅能够处理高分辨率和快速运动的视频,还能确保整个视频的风格保持一致。· 超分辨率:采用专门的控制网络进行视频的上色处理,即使输入低分辨率的视频,也能够生成高质量的动漫风格视频。5.设置开始帧0,结束帧设为视频的秒数乘以30,例如10秒视频的结束帧就是300。

2024-07-27 16:29:49 474

原创 最强AI语音克隆和文本配音工具!与真人无异,CosyVoice下载介绍

CosyVoice采用了总共超15万小时的数据训练,依托先进的大模型技术进行特征提取,从而完成声音的复刻,用户无需训练过程,仅需提供时长较短的音频,即可迅速生成高度相似且听感自然的定制声音。CosyVoice是一个大规模预训练语言模型,深度融合文本理解和语音生成的一项新型语音合成技术,能够精准解析并诠释各类文本内容,将其转化为宛如真人般的自然语音。空间大、速度快、安全稳固,支持教育网加速,支持手机端。教育场景:使用复刻老师的声音,加强师生互动,丰富教学视频和课件的内容,打造更亲切、更生动的学习体验。

2024-07-20 13:13:24 468

原创 川普真会说中文?连嘴型都同步,VideoReTalking AI数字人下载介绍

你只需要传入一个视频文件和音频文件,它会生成一个新的视频,在这个视频里,不仅人物的嘴型会与音频同步,就连表情也会随着声音的起伏发生变化,而整个过程都在没有用户干预的情况下按顺序处理。百度网盘为您提供文件的网络备份、同步和分享服务。1、表情引导:给定一个会说话的头像视频,使用表情编辑网络根据相同的表情模板修改每一帧的表情,从而生成具有规范表情的视频。2、口型同步:将规范表情视频与给定的音频一起输入口型同步网络以生成口型同步视频。1、在下载资源的根目录找到examples\face文件夹,选择其中的视频文件。

2024-06-29 14:55:14 439

原创 CodeFormer一款既能图像修复、还能视频增强去码的AI软件(下载介绍)

它可以处理视频中的各种问题,如模糊、抖动、颜色失真等,从而提供更清晰、更稳定的视频观看体验。CodeFormer通过分析视频的每一帧,对图像进行逐一修复,使得修复后的视频在细节和色彩上都更接近原始状态。由于其专为处理人脸设计,CodeFormer在人脸修复方面表现尤其出色,它可以处理各种复杂的人脸图像,从模糊到损坏,都能通过CodeFormer恢复到接近原始状态的清晰度和色彩。2、采用了预训练VQGAN离散码本空间的方法,将人脸复原任务转成Code序列的预测任务,大幅度降低了复原任务映射的不确定性。

2024-06-29 13:15:57 824

原创 VALL-EX下载介绍:只需3秒录音,即可克隆你的声音

VALL-EX是一个强大和创新的多语言文本转语音模型,支持对中文、英文和日语的语音进行合成和克隆,使用者只需上传一段3-10秒的录音,就可以生成高质量的目标音频,同时保留了说话人的声音、情感和声学环境。VALL-EX的应用范围非常广泛,可以用于跨语言文本到语音、语音合成和语音到语音翻译等各种任务,无论是商业用途还是个人使用,VALL-EX都可以帮助用户轻松地进行跨语言交流和文本转语音任务。生成的声音是基于上传的语音文件训练所得,建议多生成几次,选择效果最好的使用。3.输入待合成语音的文本内容。

2024-06-01 11:56:55 485

原创 最好用的AI换脸软件,rope下载介绍(支持cpu)

这得益于机器学习技术的不断发展,rope经过深度神经网络的无数次迭代优化,最终得出的模型可以自动学习和识别视频中的人脸特征,它可以在不损害原视频质量的情况下实现人脸的替换,而且还可以处理各种面部表情和动作,使效果更加逼真(PS:一个人脸还不够?耐心等待一段时间,视频就生成好啦,生成效率与视频长度和GPU算力有关,这里推荐GTX1060以上显卡和同等级的A卡,集成显卡也能使用。相比于挂载了各种控件、琐碎杂乱,甚至需要频繁调参的换脸软件,rope的操作界面简洁明了,不懂代码的小白也能轻松上手。

2024-05-02 13:11:09 1907 1

原创 最简单的AI换脸软件,roop下载介绍(可直播)

它最强大的地方就在于对人物表情的精准捕捉,虽说rope也能通过调整嘴唇和遮罩层高度来拟合原始人脸的神态,但roop使用起来更简单,把“换多张脸”选项打开后,点击“直播”按钮就可以实时换脸。· 保持帧率:原视频是多少帧率,合成后的视频就是多少帧率,最好启用这个参数,否则可能出现帧数不稳定的情况。此外,roop还自带预览功能,界面打开后,键盘的“↑↓”键可以切换需要替换的人脸,“←→”键是拖动进度条。设置完选项,点击“开始”按钮,在控制台中可以查看当前的处理进度,程序执行完毕会输出“成功”字样。

2024-04-24 21:29:42 1102

原创 最全能的AI换脸软件,FaceFusion下载介绍(可直播)

FaceFusion提供了预览功能,可以自由选择换脸对象和多人换脸,单人换脸通过方位选择人脸、年龄选择人脸、以及性别选择人脸。与大多数换脸软件不同的是,FaceFusion不仅支持N卡处理程序(Azure),还额外提供了CPU处理模式(渣机必备)FaceFusion是一款多功能的AI换脸软件,它不仅能图片、视频换脸,还可以直播换脸,换脸效果真实、自然。·保持帧率:让合成后的视频与原视频的帧率保持一致,一般启用这个参数。,可以在输出路径中找到换好的文件,也可以在输出界面的右上角点击下载。

2024-04-13 13:02:46 1684 1

原创 P图神器Lama下载介绍,一键移除图片中任何不想要的元素

在以前,我们想将图片中的文字、水印去除,可以使用ps,但ps的学习成本比较高,没有那么容易上手,在面对复杂的几何结构和高分辨率图像时,ps的处理效果也不是很理想,造成这种情况的主要原因是传统的图像修复系统在构造图像网络和损失函数的过程中缺乏有效的感知视野,为了解决这个问题,Lama提供了一种新的方法,称为大型掩模修复。Lama的修复网络在一系列数据集上提高到了最先进的水平,即使在复杂的场景中也能获得出色的性能,Lama可以处理超高分辨率的图像,并且在竞争基线中以更低的参数和计算成本实现了这一点。

2024-03-30 12:06:04 581 1

原创 动态水印也能去除?ProPainter一键视频抠图整合包下载

4、使用掩码引导的稀疏Transformer块对传播的特征进行精细调整,并采用仅考虑特定子集的稀疏策略,提高算法的效率,减少内存消耗,同时保持高性能水平。4、上一步完成后,点击“去水印”按钮,等待一段时间即可得到最终的结果,最后生成的视频会保存在项目路径的output文件夹下。2、在右侧的区域里,点击需要移除的物体,有时需要多点几次,尽可能让移除的对象被完整识别,如果识别错误,可以点击“撤销”对象补全:填补视频中缺失的区域,通常用于修复受损的视频帧或损坏的部分,使其看起来完整和连贯。

2024-03-23 11:12:19 690 1

原创 人人都是艺术家!AI工具Doodly让潦草手绘变精美画作

手绘一个机器人草图,辅以prompt提示「photo, photorealistic CG rendering of a robot head, predator, downtown city bokeh at night, dramatic lighting(照片,机器人头部逼真的CG渲染,铁血战士,虚化的城市夜景,戏剧光效)」,就能得到城市夜景下炫酷的机器人战士。以上都是由AI脑补出来的场景,Doodly也支持文本prompt的输入方式,由涂鸦+提示词创作的结果,更贴近于我们心中想要的答案。

2024-03-16 13:09:27 540 1

原创 照片也能说话了?嘴型表情全同步,AI数字人时代要来了

SadTalker是一款先进的人工智能模型,它通过从音频中学习生成3D运动系数,并使用全新的三维面部渲染器来生成头部运动,只需传入一张照片和一段音频,就能生成高质量的AI数字人视频。SadTalker生成后的人物头部运动规律,面部表情自然,口型也和音频的内容保持一致(小姐姐还会眨眼睛!4、使用生成的三维运动系数映射到人脸渲染的无监督三维关键点空间,合成最终视频。· 生成中的批量大小:生成视频的速度,默认1,显卡好可以适当拉大。2、通过蒸馏系数和3D渲染的脸部,从音频中学习准确的面部表情。

2024-03-09 13:02:59 673 1

原创 ChatGPT要慌了?谷歌推出最新AI大模型Gemma(可本地部署)

无论是国外的ChatGPT或者国内的“文心一言”,其服务都是以API接口的形式提供,用户在使用的过程中可能会遇到网络拥堵问题以及隐私泄露的风险,而Gemma则是本地部署,服务仅限单人使用,这种方式既提升了人机交互的频率,也不用担心个人信息被外界获取。2月21日,谷歌发布了最新一代语言大模型Gemma,与之前的Gemini模型相比,Gemma将参数扩展到了惊人的6万亿个,和ChatGPT4相当。Gemma使用起来非常简单,输入提示语,点击提交,回答的速度相当快~①项目安装路径不要包含中文。

2024-03-02 21:38:03 531

原创 一秒出图?SDXL-Turbo实时AI绘画整合包下载

SDXL Turbo是一种快速生成的AI构图模型,它基于一种称为对抗性扩散蒸馏的新训练方法,该方法允许在1到4个步骤中以高图像质量对大规模基础图像扩散模型进行采样,并将其与对抗性损失相结合,以确保即使在一个或两个采样步骤的低阶模式下也能获得高图像保真度。博主GTX2070的显卡,使用Stable Diffuison需要一分多钟才可出图,SDXL Turbo10秒左右就搞定了。简单说,就是快速成图的同时质量上却不打折扣,SDXL Turbo有多快?2.图生图:上传本地图片,输入提示词,点击Generate。

2024-02-25 18:49:42 693 1

原创 AI抠图神器RMBG下载介绍

RMBG是一款先进的AI抠图工具,和其它同类型软件不同的是,RMBG不需要人工勾勒图形轮廓,可以自动识别图像的前景并去除背景,节省大量时间,效果非常惊艳。RMBG迭代消耗了数万张高质量、高分辨率、手动标记、高像素精度、完全授权的图像,它的准确性、效率和多功能性可以与市面上领先的商业产品相媲美(无次数限制)RMBG的模型是在精心选择的数据集上训练的,包括各种日常图像、电子商务、游戏和广告内容,适用于推动企业创建大规模的商业用例。RMBG使用起来非常简单,只需要上传一张图片,提交等待,3秒内就能输出结果。

2024-02-17 16:58:13 614 1

原创 CodeFormer一款既能人脸修复、还能视频去码的AI软件,附下载使用教程

它可以处理视频中的各种问题,如模糊、抖动、颜色失真等,从而提供更清晰、更稳定的视频观看体验。CodeFormer通过分析视频的每一帧,对图像进行逐一修复,使得修复后的视频在细节和色彩上都更接近原始状态。由于其专为处理人脸设计,CodeFormer在人脸修复方面表现尤其出色,它可以处理各种复杂的人脸图像,从模糊到损坏,都能通过CodeFormer恢复到接近原始状态的清晰度和色彩。2、采用了预训练VQGAN离散码本空间的方法,将人脸复原任务转成Code序列的预测任务,大幅度降低了复原任务映射的不确定性。

2024-01-17 11:03:51 4800

原创 川普真会说中文?连嘴型都同步,用VideoReTalking一键生成你的AI播报员

你只需要传入一个视频文件和音频文件,它会生成一个新的视频,在这个视频里,不仅人物的嘴型会与音频同步,就连表情也会随着声音的起伏发生变化,而整个过程都在没有用户干预的情况下按顺序处理。百度网盘为您提供文件的网络备份、同步和分享服务。1、表情引导:给定一个会说话的头像视频,使用表情编辑网络根据相同的表情模板修改每一帧的表情,从而生成具有规范表情的视频。2、口型同步:将规范表情视频与给定的音频一起输入口型同步网络以生成口型同步视频。1、在下载资源的根目录找到examples\face文件夹,选择其中的视频文件。

2024-01-04 15:40:37 735 1

原创 98秒转录2.5小时音频,最强音频转文字软件insanely-fast-whisper下载部署

Whisper-Large-v3:OpenAI推出的一种用于自动语音识别(ASR)和语音翻译的预训练模型,经过168万小时的标记数据训练,显示出强大的能力,可以在不需要微调的情况下推广到许多数据集和领域。6、选择处理速度,这个值并不是越大越好,博主GTX1660的显卡设置成1最为合适,配置好可以适当调大。4、选择音频语言,程序会识别语言也可以手动选择语言,选择与音频不同的语言,生成的结果是选择后的语言。7、记录音频形式,按词或片段记录音频,根据自己的需要选择,文件末尾会输出完整的文本。

2023-12-27 23:59:47 650

原创 最简单的AI绘画软件,roop下载分享(可直播)

它最强大的地方就在于对人物表情的精准捕捉,虽说rope也能通过调整嘴唇和遮罩层高度来拟合原始人物的神态,但roop使用起来更简单。此外,roop还自带预览功能,界面打开后,键盘的“↑↓”键可以切换需要替换的目标,“←→”键是拖动进度条。保持帧率:原视频是多少帧率,合成后的视频就是多少帧率,最好启用这个参数,否则可能出现帧数不稳定的情况。设置完选项,点击“开始”按钮,在控制台中可以查看当前的处理进度,程序执行完毕会输出“成功”字样。PS:最近天气是越来越冷了,北方的朋友注意保暖,南方的朋友应该也要多穿点😎?

2023-12-17 23:31:59 814 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除