摘要
为更有效地对低资源少数民族语言进行语音识别研究,提出一种SE-Block与Inception_Resnet_v2相结合的深度神经网络模型。该模型引入Inception结构提取语谱图特征,同时引入SE-Block增强网络对特征维度的信息通道选择能力,优化网络性能。实验结果表明,相比其他主流模型,该模型在提高模型精度与训练收敛速度的同时,增强了网络的整体学习能力。实验在佤语数据集上取得良好的学习效果,验证了该模型在数据样本数量有限的低资源少数民族语音识别中的高效性。
0 引言
语言是人类相互间传递信息最原始、便捷的工具,更是文化传承的重要载体[1]。汉语和少数民族语言作为中华民族文化的瑰宝,更是一个民族重要的象征。然而,在当今全球化发展的进程中,伴随着各民族文化的融合,少数民族语言文化遗产的传承与保护迫在眉睫。其中,对于跨中缅边境的少数民族——佤族而