第12章 端到端(E2E)语音识别
CTC的前向后向算法可以引导输出序列与输入序列按时间顺序对齐,而Attention模型的对齐关系没有 先后顺序的限制,完全靠数据驱动得到,难以训练。因此CTC和Attention模型各有优势,可把两者结 合起来,构建Hybrid CTC/Attention模型,采用多任务学习,通过CTC避免对齐关系过于随机,以加快 训练流程。
第12章 端到端(E2E)语音识别
CTC的前向后向算法可以引导输出序列与输入序列按时间顺序对齐,而Attention模型的对齐关系没有 先后顺序的限制,完全靠数据驱动得到,难以训练。因此CTC和Attention模型各有优势,可把两者结 合起来,构建Hybrid CTC/Attention模型,采用多任务学习,通过CTC避免对齐关系过于随机,以加快 训练流程。