- 项目复现 -
文章平均质量分 84
记录项目的复现流程,操作运行。
夏天|여름이다
人工智能研究员,致力于计算机视觉,自然语言处理,语音处理,多模态模型,强化学习等相关研究。
展开
-
TTS | VocGAN声码器训练自己的数据集
本博客主要介绍的是如何使用VocGAN声码器训练不同的数据集~原创 2023-08-16 08:38:22 · 461 阅读 · 0 评论 -
SER | 语音情绪识别 | TIM-NET_SER项目实现,以及训练自己的语音数据集,后期修改网络
大家好,今天复现的是目前语音情绪识别的SOTA论文,论文中文名称是时间建模的重要性: 用于语音情感识别的新型时空情感建模方法。论文中训练的数据集有英文德语等几个语音情绪识别中常见的语音情绪数据集,以对比精度权重等效果~各数据集的情绪数量不同,可参考以下代码论文地址 |项目地址 |一般语音训练对计算机的内存有要求,一般情况下建议内存超过12G(要不然很容易出现out of memery).原创 2023-04-14 15:31:27 · 1800 阅读 · 0 评论 -
TTS | 基于FastSpeech2的语音中英文语音合成项目
环境:Ubuntu(docker),pytorch,原创 2023-04-04 13:24:20 · 3644 阅读 · 7 评论 -
TTS | 利用Fastspeech训练LJSpeech语音数据集后英文文本生成语音及代码详解
基于的前馈网络,用于并行生成梅尔谱图。模型与自回归相比,梅尔谱图生成速度加快了270倍,端到端语音合成速度加快了38倍。项目实现把下载的预训练模型改名为解压文件当当前文件夹然后运行处理完数据后,开始进行训练(训练将近一周)训练后如图训练后进行验证,先修改eval.py中的超参数 --step ,改为自己刚训练后的model_new文件夹下的checkpoint后面的数,如图我的情况把默认0,改为768000,如下然后再运行(如果运行后出现错误,请参考Q&A2)结果显示如图。原创 2023-09-20 12:57:45 · 739 阅读 · 0 评论 -
YOLO | 用YOLOv7训练自己的数据集(超详细版)
第一次训练时,在ymal文件中未设置train_list.txt和val_list.txt,可以训练,未提示错误,yaml文件如下,数据是从Rowblow上下载好的格式(不是自己的数据集)。nc: 38names: [#这里省略]个人认为默认指向路径下的图片,具体原因还在研究中。。。yolov7训练时的出来labels指的是什么,为什么每一个epoch的标签数都不同?原创 2023-02-07 15:17:45 · 25828 阅读 · 9 评论 -
项目复现 | DETR:利用transformers端到端的目标检测
论文:End-to-End Object Detection with Transformers论文详解地址:方法一。原创 2022-09-12 01:07:02 · 4679 阅读 · 0 评论 -
实用篇 | 做自己的管理系统 :Pycharm+django+mysql
做自己想要的进销存系统!!!原创 2022-08-29 00:26:23 · 2522 阅读 · 1 评论 -
❀项目复现❀基于上下文的情绪识别论文项目实现
2017年Emotion Recognition in context 情景中的情绪的感知论文中提出emotic数据集。原创 2022-06-01 16:28:20 · 2006 阅读 · 20 评论 -
❀项目复现❀基于CIFAR-10+LeNet的训练实现
环境要求pytorch基于pytorch深度学习框架,利用数据集CIFAR-10,在网络lenet5上进行 训练。在torch中datasets可直接加载,所以不用单独下载。Step1:在pycharm中写入lenet5main.py写入如下代码,用来下载数据集#cifar10数据集+LeNet10网络实现训练import torch#DataLoader可加载多个from torch.utils.data import DataLoaderfrom torchvisio原创 2022-04-07 01:55:54 · 991 阅读 · 0 评论