ai语音
文章平均质量分 66
昨日之日2006
人工智能影像爱好者!
展开
-
Easy Voice Toolkit - 简易语音工具箱,一款强大的语音识别、转录、转换工具 本地一键整合包下载
Easy Voice Toolkit 是一个基于开源语音项目实现的简易语音工具箱,提供了包括语音模型训练在内的多种自动化音频工具,集成了GUI,无需配置,解压即用。原创 2024-09-05 09:13:55 · 421 阅读 · 0 评论 -
audiocraft - 免费文本转音乐、AI音乐生成、AI音乐创作工具,Facebook开源,本地一键整合包下载
这个强大的工具包集成了两个最新的AI音频生成模型:AudioGen和MusicGen,能够产生高质量的声音和音乐。如果你的显卡较好,显存12G起,推荐facebook/musicgen-stereo-melody和facebook/musicgen-stereo-melody-large这两个模型,生成的效果是最好的。考虑到一键包大小,一键包只内置了 facebook/musicgen-stereo-melody 这个模型,如果需要体验其他模型,只需要切换到任意模型,提交的时候后台会自动下载。原创 2024-08-31 22:27:22 · 690 阅读 · 0 评论 -
【AI语音克隆】GPT-SoVITS V2版,业界最强的AI声音克隆软件、文本转语音工具,新增两种新语种,更强的V2模型
【AI语音克隆】GPT-SoVITS V2版,业界最强的AI声音克隆软件、文本转语音工具,新增两种新语种,更强的V2模型原创 2024-08-10 17:01:01 · 742 阅读 · 0 评论 -
CosyVoice升级版 - 阿里最新开源语音克隆、文本转语音项目 支持音色保存 本地一键整合包下载
近日,阿里通义实验室发布开源语音大模型项目FunAudioLLM,而且一次包含两个模型:SenseVoice和CosyVoice。今天分享的这个是v3ucn大佬优化过的升级版,新增自定义音色保存,优化长文本生成以及修复上个版本错误提示的bug。原创 2024-07-10 13:31:01 · 1707 阅读 · 0 评论 -
SenseVoice - 阿里最新开源精准多语言语音识别与情感辨识模型 本地一键整合包下载
阿里巴巴近期发布了开源语音大模型项目FunAudioLLM,该项目包含了两个核心模型:SenseVoice和CosyVoice。可以精准多语言识别并且进行语音克隆原创 2024-07-09 15:32:02 · 954 阅读 · 0 评论 -
CosyVoice - 阿里最新开源语音克隆、文本转语音项目 支持情感控制及粤语 本地一键整合包下载
CosyVoice专注自然语音生成,支持多语言、音色和情感控制,支持中英日粤韩5种语言的生成,效果显著优于传统语音生成模型。原创 2024-07-07 21:19:42 · 6928 阅读 · 0 评论 -
AI一键音频转文字工具 速度超快,支持实时转换,无需联网,本地整合包下载
这是 CapsWriter-Offline ,一个 PC 端的语音输入、字幕转录工具。可用实现简单一键将音频文件转换成文字的懒人工具。原创 2024-07-03 09:36:32 · 873 阅读 · 0 评论 -
DCT-Net - 一键图片、视频转卡通动漫风格工具,本地一键整合包下载
只需要输入一张人物图像或者一段视频,就可以实现端到端全图卡、视频通化转换,生成二次元虚拟形象,返回卡通化后的结果图像或视频。原创 2024-06-25 16:33:48 · 320 阅读 · 0 评论