kaldi
cageyoko
qq:530848780
mail:[email protected]
展开
-
py 直接提取f0
import pyworld as pw import soundfile as sf WAV_FILE = "aa.wav" x, fs = sf.read(WAV_FILE) f0, sp, ap = pw.wav2world(x, fs, fft_size=512, f0_floor=50)原创 2020-07-03 17:06:12 · 659 阅读 · 0 评论 -
Kaldi学习-----上名词的一些理解(一)
acoustic scale: 通常设置为0.1,意味着声学模型的log概率得到的权重远低于语言模型。在Score的脚本中,经常会看到一系列要搜索的语言模型权重(例如7到15的范围)。 这些可以解释为声acoustic scale的倒数; 这是两者对维特比解码很重要的比例alignment:表示一句话通过维特比(最佳路径)对齐的HMM状态序列表示,与transtions-id同义。show-ali...原创 2018-07-12 17:26:30 · 839 阅读 · 0 评论