使用大模型进行公式识别并且以LaTeX形式输出与OCR公式识别工具介绍

本文用来测试使用大模型与一些OCR工具来识别公式并将其转换成LaTeX形式的代码。旨在帮助在论文中需要编辑复杂公式的人快速高效处理公式内容。


测试的大模型包括:

智谱清言:智谱清言

KimiChat:Kimi.ai - 帮你看更大的世界 (moonshot.cn)

讯飞星火:讯飞星火大模型-AI大语言模型-星火大模型-科大讯飞 (xfyun.cn)

通义千问:通义 (aliyun.com)

其他OCR工具:

Doc2X:Doc2X

latexocr 开源项目(需要Pytorch环境):LaTeX-OCR 识别数学公式,手写字符,转化为 LaTeX 代码; 写论文必备 数学公式轻松搞定!!

四组测试公式分别为:

 

 

 

 TEST-1

智谱清言:

Kimichat:

通义:

讯飞星火:

Doc2X:

LaTeXOCR:

 TEST-2

智谱清言:

Kimichat:

通义:

讯飞星火:

Doc2X:

LaTeXOCR:

 TEST-3

智谱清言:

Kimichat:

通义:

讯飞星火:

Doc2X:

LaTeXOCR:

 TEST-4

智谱清言:

Kimichat:

通义:

讯飞星火:

Doc2X:

LaTeXOCR: 

总结:

大模型里面,通义应该是最好用,比较复杂的就不要用 KimiChat和智谱了

Doc2X很好用,LaTeXOCR那个要不是已经有pytorch环境的话感觉没啥必要装

  • 4
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值