数据格式
文章平均质量分 58
hjx5200
这个作者很懒,什么都没留下…
展开
-
语音研究实力个人及单位
1.中国科学技术大学语音及语言信息处理国家工程实验室语音及语言信息处理国家工程实验室,英文缩写为:“NEL-SLIP”。围绕语音及语言核心技术及产业发展需要,建立语音及语言技术研究、工程化应用的研究开发平台和测试验证平台,开展自然人机交互、人工智能、海量信息处理及挖掘等重点领域的研究并实现产业化,形成从核心技术研究到技术运营服务的完整产业链,提升我国在相关领域的自主创新能力和核心竞争力,促进我国语音及相关产业的快速发展。http://nelslip.ustc.edu.cn/2.中国科学院..原创 2021-07-05 08:48:01 · 1359 阅读 · 0 评论 -
HTK standard lattice format
这个格式描述了HTK词网络,主要包含两部分,头部和节点/边定义。在头部,主要包含版本信息,以及该词网络包含多少个节点和多少条边,分别以字母N和L表示。在body部分,分别定义节点的编号和词本体信息;边的编号以及边的起点和终点信息,可选的有语言模型的分数。下面是典型的SLF文件格式。VERSION=1.0N=31 L=62 I=0 W=SENT-END I=1 W=YOUNG I=2 W=!NULL原创 2021-06-28 21:52:20 · 140 阅读 · 0 评论 -
kaldi文件格式
kaldi文件分两大类:列表表单(.scp结尾)和存档表单(.ark结尾)。它们是配合的。列表表单的每个元素占一行,每行分两个字段,前一个是索引(index),后一个文件(file)。audio_index1 /paht/to/audio1.wav audio_index2 /paht/to/audio2.wav audio_index3 /paht/to/audio3.wav 但是需要说明一点,“文件”的本质是一个存储地址,它可能是在磁盘上,也可能是在内存上。还可能是原创 2021-05-25 14:17:52 · 681 阅读 · 0 评论 -
wave文件格式详解
第一节 wav格式scheme介绍wav格式,是微软开发的一种文件格式规范,整个文件分为两部分。第一部分是“总文件头”,就包括两个信息,chunkID,其值为“RIFF”,占四个字节;ChunkSize,其值是整个wav文件除去chunkID和ChunkSize,后面所有文件大小的字节数,占四个字节。第二部分是Format,其值为“wave”,占四个字节。它包括两个子chunk,分别是“fmt ”和“data”。在fmt子chunk中定义了该文件格式的参数信息,对于音频而言,包括:采样率、通道数、位原创 2020-06-29 17:59:36 · 9337 阅读 · 0 评论