月逝天-CSDN博客

转载 TTS语音合成评测指标MOS

针对上文提到的前后端可能存在的问题，选择如下指标来评测TTS。本章详细介绍评测时重点关注的发音准确性评测和MOS评测。发音准确性测试的目的是评估前端发音预测能力，挖掘badcase，通过多轮修复和回归，提升系统发音准确率。特殊读音的姓氏：被测系统应该有能力根据上下文区别姓氏的特殊读音，如“报仇”和“仇老五”，“仇“做为姓时应该读为qiu2。数字进制：被测系统应该按照汉语习惯对数字的进制正确发音，如宝马4系列的轿车需要896,500元，“896,500”应展开为“八十九万六千五百”。年代。

2024-01-16 14:37:13 4938 1

原创基于四系统的文本分类（TextClassify_FourSystems）

基于四系统的文本分类（TextClassify_FourSystems）说明环境数据Train最后说明本文主要是实现NLP文本分类任务，目前该系统为四系统融合模型，其中包括基于字向量char的CNN模型、RCNN模型以及基于词向量word2vec的CNN模型、RCNN模型。目前的融合规则采用权值平均法进行融合。github:环境python3tensorflow数据所使用的数据为网上的cnews数据，共10个类别，分为训练集，验证集和测试集。类别如下：体育, 财经, 房产, 家居,

2020-06-10 16:16:18 414

原创 python：制作水印图片

在做一些工作的时候，有时候会涉及到给图片加上水印，这个如果手动添加的话，效率太低了，通常选择代码完成。下面这个是给图像添加文字水印（图片水印还在研究中~~）比如，在下面的图片中添加 “美团外卖” 水印from PIL import Image,ImageDraw,ImageFontimport numpy as npimport randomimport cv2import ...

2019-09-12 16:29:33 1457

原创人工智障与深度学渣之问题集锦：ValueError: Shape must be rank 4 but is rank 1 for 'Conv2D' with input shapes。。。

醉最近在写网络的时候，总会遇到一些坑，虽然大部分都能百度到，但还是有一些坑让我郁闷。比较好久没写网络了，以前的填坑经验也都忘了。比如这里的报错：ValueError: Shape must be rank 4 but is rank 1 for 'Conv2D' (op: 'Conv2D') with input shapes: [1,32,280,1], [4].在CSDN上好像也没找找...

2019-08-05 19:15:34 10887

情感分类文本数据.zip

中文情感分类文本数据，为正负二分类数据，包括pad,水果，洗发水，酒店等评论。每个场景正负样本共1万，共5个场景。同时还包含不分场景的数据6万多（不重复）

2019-11-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人