本文用来测试使用大模型与一些OCR工具来识别公式并将其转换成LaTeX形式的代码。旨在帮助在论文中需要编辑复杂公式的人快速高效处理公式内容。
测试的大模型包括:
智谱清言:智谱清言
KimiChat:Kimi.ai - 帮你看更大的世界 (moonshot.cn)
讯飞星火:讯飞星火大模型-AI大语言模型-星火大模型-科大讯飞 (xfyun.cn)
通义千问:通义 (aliyun.com)
其他OCR工具:
Doc2X:Doc2X
latexocr 开源项目(需要Pytorch环境):LaTeX-OCR 识别数学公式,手写字符,转化为 LaTeX 代码; 写论文必备 数学公式轻松搞定!!
四组测试公式分别为:
TEST-1
智谱清言:
Kimichat:
通义:
讯飞星火:
Doc2X:
LaTeXOCR:
TEST-2
智谱清言:
Kimichat:
通义:
讯飞星火:
Doc2X:
LaTeXOCR:
TEST-3
智谱清言:
Kimichat:
通义:
讯飞星火:
Doc2X:
LaTeXOCR:
TEST-4
智谱清言:
Kimichat:
通义:
讯飞星火:
Doc2X:
LaTeXOCR:
总结:
大模型里面,通义应该是最好用,比较复杂的就不要用 KimiChat和智谱了
Doc2X很好用,LaTeXOCR那个要不是已经有pytorch环境的话感觉没啥必要装