处理音频文件时候 解决方向: 有一些损坏的wav文件(很小,但有讲话)导致了这一现象当wav文件是立体声而不是单声道时,这种情况也是可能的。Tacotron正在使用16kHz 16bit单声道进行训练 参考资料: https://github.com/NVIDIA/tacotron2/issues/113