自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 centos 7 安装mongdb3.6

MongoDB是一个领先的NoSQL数据库,由MongoDB Inc.(原10gen)开发,以其高性能、高可用性和易扩展性而闻名。MongoDB是一个文档数据库,这意味着它以文档(类似于JSON对象)的形式存储数据。作为一个非关系型数据库,MongoDB为开发人员提供了一种灵活、动态的方法来存储和处理数据。

2018-04-17 15:26:15 314 1

原创 centos 7 下安装php 7

【代码】centos 7 下安装php 7。

2018-04-17 10:02:05 710 1

AVSpeech视听语音数据集

AVSpeech 是一个新的、大规模的视听数据集,包括没有干扰的背景噪音的语音视频片段。这些片段的长度为 3-10 秒,在每个片段中,原声带中的听到的声音,属于视频中可看见的唯一在说话的人。 该数据集包含大约 4700 小时的视频片段,来自 29 万个 YouTube 视频,涵盖了各种各样的人、语言和面部姿势。

2024-02-06

猫狗二分类数据集,用于计算机视觉分类训练

猫狗二分类数据集,用于计算机视觉分类训练,里面包含两个文件夹,train中包含25000张分类好的猫狗图片,valid中包含12500张未分类的猫狗图片。

2023-08-02

水果照片数据集02,用于水果识别模型的训练

水果照片数据集02,用于水果识别模型的训练,每个文件夹中包含一类水果的照片

2023-08-02

水果照片数据集01,用于水果识别模型的训练

水果照片数据集01,用于水果识别模型的训练,每个文件夹中包含一类水果的照片

2023-08-02

faceswap预训练模型

FaceSwap的作用就是使用深度学习来识别和交换图片和视频中的人脸的工具。Faceswap利用深度学习算法和人脸识别技术,可以将一个人的面部表情、眼睛、嘴巴等特征从一张照片或视频中提取出来,并将其与另一个人的面部特征进行匹配。

2023-06-29

基于bert的韵律预训练模型

基于bert的韵律预训练模型,用于中文语音生成,生成自然韵律的声音,听起来效果更加自然流畅

2023-06-27

Wav2Lip-HD预训练模型第二个包,包含GFPGAN模型等,用于数字人语音驱动面部及图像超分辨率生成

Wav2Lip-HD预训练模型第二个包,包含GFPGAN模型等,用于数字人语音驱动面部及图像超分辨率生成

2023-06-20

Wav2Lip-HD预训练模型第一个包,包含人脸检测模型,语音驱动面部模型等

Wav2Lip-HD预训练模型第一个包,包含人脸检测模型,语音驱动面部模型等,用于数字人语音驱动面部及图像超分辨率

2023-06-20

Wav2lip预训练模型,包含人脸检测模型、面部表情生成模型、基于gan的面部表情生成模型、生成判别模型等

Wav2lip预训练模型,包含人脸检测模型、wav2lip生成模型、wav2lip_gan生成模型、wav2lip判别模型等,使用此模型通过音频驱动视频,生成最终的嘴型与语音的匹配

2023-06-16

VITS-fast-fine-tuning训练准备的样例数据,可以快速体验该模型的语音合成效果

VITS-fast-fine-tuning训练准备的样例数据,可以快速体验该模型的语音合成效果。内容包含预训练模型、配置文件、语音素材等。

2023-06-09

vits-chinese模型使用标贝男声数据,经过700K step训练后模型,新speaker可以在此模型上二次训练

vits_chinese模型使用标贝男声数据,经过700K step训练后模型,新speaker可以在此模型上二次训练,达到快速收敛的效果。

2023-06-08

vits训练音频结果展示

vits训练音频结果展示

2023-05-27

标贝数据集标注数据,用于采用标贝数据进行基础模型训练,内容为10000条标注数据

标贝数据集标注数据,用于采用标贝数据进行基础模型训练,内容为10000条语音标注数据,数据文件对应的地址: https://download.csdn.net/download/lsb2002/87818023 https://download.csdn.net/download/lsb2002/87818053

2023-05-25

标贝男声数据集,用于人工智能语音合成训练,内容为10000条男声音频以及标注

标贝男声数据集,用于人工智能语音合成训练,音频采用频率22050,此数据为第二个分包,总共二个分包。 第一个包地址为:https://download.csdn.net/download/lsb2002/87770781 标注数据地址为:https://download.csdn.net/download/lsb2002/87818104

2023-05-25

标贝男声数据集,用于人工智能语音合成训练,内容为10000条带标注的男声数据

标贝男声数据集,用于人工智能语音合成训练,音频采用频率22050,此数据为第一个分包,总共二个分包 第一个包地址:https://download.csdn.net/download/lsb2002/87818053 标注数据地址:https://download.csdn.net/download/lsb2002/87818104

2023-05-25

标贝女声数据集,用于人工智能语音合成训练

标贝女声数据集,用于人工智能语音合成训练,音频采用频率22050,此数据为第二个分包,总共二个分包

2023-05-10

标贝女生数据集,用于人工智能语音合成训练

标贝女生数据集,用于人工智能语音合成训练,音频采用频率22050,此数据为第一个分包,总共二个分包

2023-05-10

标贝男声数据集,用于人工智能语音合成训练

标贝男声数据集,用于人工智能语音合成训练,音频采用频率44100,此数据为第三个分包,总共三个分包

2023-05-10

标贝男声数据集,用于人工智能语音合成训练

标贝男声数据集,用于人工智能语音合成训练,音频采用频率44100,此数据为第二个分包,总共三个分包

2023-05-10

标贝男声数据集,用于人工智能语音合成训练

标贝男声数据集,用于人工智能语音合成训练,音频采用频率44100,此数据为第一个分包,总共三个分包

2023-05-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除