VGSL是Variable-size Graph Specification Language的缩写,它定义了一种语法规范,用来表明你用Tesseract-OCR训练时的网络参数。听起来有些迷糊,容我慢慢道来。
Wiki上给出的重头开始训练模型的命令为
lstmtraining --debug_interval 0 \
--traineddata ~/tesstutorial/engtrain/eng/eng.traineddata \
--net_spec '[1,36,0,1 Ct3,3,16 Mp3,3 Lfys48 Lfx96 Lrx96 Lfx256 O1c111]' \
--model_output ~/tesstutorial/engoutput/base --learning_rate 20e-4 \
--train_listfile ~/tesstutorial/engtrain/eng.training_files.txt \
--eval_listfile ~/tesstutorial/engeval/eng.training_files.txt \
--max_iterations 400 &>~/tesstutorial/engoutput/basetrain.log
这里的--net_spec即为你定义的网络参数,而它就是依据VGSL。再者,我们做fine tuned时可能会用到如下类似的命令:
lstmtraining --debug_interval 0 \
--continue_from ~/tes