1. 在train.py中进行模型训练,导出为pth
2. 在infer.py->predict.py中的predict函数中,加载模型之后进行torch.onnx.export()
但注意,因为在量化时需要校准文件,所以需要将一部分wav文件读取特征后转化为bin文件,但需要注意wav文件的尺寸,此处设置的[1,398,80]是4s的文件
转化bin文件是通过
feature_np.tofile("data.bin")
3. 通过修改magik.cfg中的input,修改模型input入口,注意是此处应是batchnorm层的output
通过指定bin文件目录,可以修改参与校准的bin文件。也就是修改QUANT_DATASET_PATH和DEBUG_PATH
4. 通过vim修改post_quantizie.sh,将所需要的量化的模型作为参数传入,之后执行
./post_quantize.sh