- 博客(4)
- 资源 (1)
- 收藏
- 关注
转载 TTS语音合成评测指标MOS
针对上文提到的前后端可能存在的问题,选择如下指标来评测TTS。本章详细介绍评测时重点关注的发音准确性评测和MOS评测。发音准确性测试的目的是评估前端发音预测能力,挖掘badcase,通过多轮修复和回归,提升系统发音准确率。特殊读音的姓氏:被测系统应该有能力根据上下文区别姓氏的特殊读音,如“报仇”和“仇老五”,“仇“做为姓时应该读为qiu2。数字进制:被测系统应该按照汉语习惯对数字的进制正确发音,如宝马4系列的轿车需要896,500元,“896,500”应展开为“八十九万六千五百”。年代。
2024-01-16 14:37:13 1419 1
原创 基于四系统的文本分类(TextClassify_FourSystems)
基于四系统的文本分类(TextClassify_FourSystems)说明环境数据Train最后说明本文主要是实现NLP文本分类任务,目前该系统为四系统融合模型,其中包括基于字向量char的CNN模型、RCNN模型 以及 基于词向量word2vec的CNN模型、RCNN模型。目前的融合规则采用权值平均法进行融合。github:环境python3tensorflow数据所使用的数据为网上的cnews数据,共10个类别,分为训练集,验证集和测试集。 类别如下:体育, 财经, 房产, 家居,
2020-06-10 16:16:18 338
原创 python:制作水印图片
在做一些工作的时候,有时候会涉及到给图片加上水印,这个如果手动添加的话,效率太低了,通常选择代码完成。下面这个是给图像添加文字水印(图片水印还在研究中~~)比如,在下面的图片中添加 “美团外卖” 水印from PIL import Image,ImageDraw,ImageFontimport numpy as npimport randomimport cv2import ...
2019-09-12 16:29:33 1237
原创 人工智障与深度学渣之问题集锦:ValueError: Shape must be rank 4 but is rank 1 for 'Conv2D' with input shapes。。。
醉最近在写网络的时候,总会遇到一些坑,虽然大部分都能百度到,但还是有一些坑让我郁闷。比较好久没写网络了,以前的填坑经验也都忘了。比如这里的报错:ValueError: Shape must be rank 4 but is rank 1 for 'Conv2D' (op: 'Conv2D') with input shapes: [1,32,280,1], [4].在CSDN上好像也没找找...
2019-08-05 19:15:34 10676
情感分类文本数据.zip
2019-11-28
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人