kaldi的I/O机制比较特殊,它是将特征、mfcc向量等保存在.ark文件中,通过.scp文件进行索引。为了方便分析,有时候需要将特征转换成numpy形式保存。最近在github上搜寻发现一个非常好用的python工具kaldiio,可以直接将ark转换成numpy array。
使用方式:
首先安装:
pip install kaldiio
从.ark文件到numpy array
import kaldiio
numpy_array = kaldiio.load_mat("xvector.ark:1453")
github项目地址:https://github.com/nttcslab-sp/kaldiio