公式检测与识别流程ocr detect and reg
A 训练样本生成流程
1、使用yolox在img上检测到目标公式的坐标
yolox 公式检测
2、在原始图片img上裁切子图
tools/labelimg_cut.py
3、对子图生成latex公式
tools/matepix.py
4、对子图重命名而进一步整理成可以生成pkl的样本
LaTeX_OCR/data_progresss/pre_process.py
katex2latex
/home/yuki/Downloads/ocr/latex/BTTR-main/Data_progress/pre_process_caption.py\
5、对上一步的图片生成pkl样本
/home/yuki/Downloads/ocr/latex/LaTeX-OCR-main/pix2tex/dataset/dataset.py
LaTeX_OCR/dataset/dataset.py
B 模型训练流程
1 修改文件中數據輸入與輸出的配置
LaTeX-OCR/settings/default.yaml
2.1 運行下面文件就可以開始訓練模型了
LaTeX-OCR/train.py
2.2在yolox_ocr_detect中也可以正常训练,使用的环境为python37base
使用的工作路径为yolox_ocr_detect中的latex_Ocr