因为第一次使用gpu进行大规模数据运算,也是第一次跑语音识别中的tandem任务,中间走了不少弯路,也耗费了不少时间。 很有必要总结些经验教训。
进展:第一次tandem跑成功,但识别率低于mle的,有两个原因:丢掉一台服务器上的数据(懒)和生成测试merge特征时,没有注意klt变换所用到的state是训练集的(粗心,自以为是,没有深入调研)。所以要跑第二次,虽然每跑一次,需要几个月时间,但是没有结果,还是要跑啊。第二遍,是从去年寒假前开始跑,但是76.105机器的cuda好像有问题,可我一直以为我的data文件有问题,中间忙碌其它事情,一直延续到今天,才发现问题的所在,今天新买和装了76.108,在上面重跑我的程序,一跑就通。下面,我要重装我的76.104系统和cuda,希望早点跑完我的2300个小时的tandem任务。
深刻教训:
①当初94挂掉的时候,就不要偷懒,重新分配
②磨刀不误砍柴工,一开始就要用最好的模型(DT)去跑,因为只有这样,才能保证有好的结果
③仔细看师兄的程序,要看懂,至少要看到注意点