LaTeX−OCR本地搭建记录

L a T e X − O C R LaTeX-OCR LaTeXOCR本地搭建记录

LaTeX-OCR是一个开源的OCR项目,旨在将手写或打印的LaTeX数学公式的图像转换为可编辑的LaTeX代码

github链接
pix2tex LaTeX-OCR

运行要求:

python 3.7+
PyTorch

电脑信息

Windows 10专业版
版本 22H2(操作系统内部版本 19045.4412)

处理器(CPU) AMD Ryzen 7 4800H with Radeon Graphics 2.90 GHz
GPU 0 NVIDIA GeForce RTX 2060
GPU 1 AMD Radeon(TM) Graphics

在命令提示符(CMD)或文件资源管理器的地址栏中输入winver并按下回车,可出现关于Windows窗口

显示结果

命令行窗口输入nvidia-smi,可显示NVIDIA GPU的详细信息,
nvidia-smiNVIDIA System Management Interface的缩写,是一个命令行工具,可查看驱动程序版本与安装在系统上的CUDA(Compute Unified Device Architecture)版本

python环境初始化

python版本 3.11.1 官网要求Python版本3.7+

命令行输入python --versionpython -V即可查看当前系统正在使用的Python解释器版本号;使用python -VV查看更详细的python配置信息

venv虚拟环境(virtual environment)创建

创建虚拟环境

python -m venv LaTeX-OCR venv

运行上述程序,即在当前路径下创建LaTeX-OCR venv目录,并在其中创建包含 Python 解释器副本和各种支持文件的目录

激活虚拟环境

进入LaTeX-OCR-env文件夹,运行Scripts\activate即可激活虚拟环境,虚拟环境激活成功后,可在左侧看到(LaTeX-OCR-env)的提示

PyTorch安装

在激活LaTeX-OCR-env虚拟环境后,可在当前虚拟环境下安装pytorchLaTeX-OCR

pytorch官网

在安装界面可以看到有不同的操作系统与包管理器选择,我使用的CUDA版本为11.7,需要安装之前的版本,可以根据以下链接选择自己对应的版本
先前版本

pip安装命令为
pip install torch==2.0.1 torchvision==0.15.2 torchaudio==2.0.2 --index-url https://download.pytorch.org/whl/cu117

验证pytorch GPU是否安装成功(能用)
在虚拟环境下依次输入
python
import torch
torch.cuda.is_available()
结果返回true表示可用,如图所示

安装LaTeX-OCR

虚拟环境下运行pip install "pix2tex[gui]"即可安装,安装成功后,下载模型权重文件,虚拟环境下运行latexocr即可弹出GUI界面
模型权重文件下载地址

使用示例

待识别公式图片

在几秒内即可识别成功,识别结果如下

e x = ∑ n = 0 ∞ x n n ! = 1 + x + x 2 2 ! + ⋯ + x n n ! + ⋯   , x ∈ ( − ∞ , + ∞ ) \mathrm{e}^{x}=\sum_{n=0}^{\infty}{\frac{x^{n}}{n!}}=1+x+{\frac{x^{2}}{2!}}+\cdots+{\frac{x^{n}}{n!}}+\cdots,\quad x\in(-\infty,+\infty) ex=n=0n!xn=1+x+2!x2++n!xn+,x(,+)

参考链接

CUDA版本 更新
2023最新pytorch安装(超详细版)
Mathpix平替工具pix2tex/Latex-OCR完全使用教程
【LaTeX】数学公式/文档识别编辑软件/工具合集(含下载地址和使用指南
离线LaTex公式识别工具/模型调研
GitHub项目·LaTex OCR·一款免费的公式识别器
图像截屏公式识别——LaTeX-OCR安装与使用
数学公式KaTex识别神器,LaTex-OCR
在conda虚拟环境中配置cuda+cudnn+pytorch深度学习环境(新手必看!简单可行!)
其他开源项目


pip源

PyCharm配置/更换镜像源及安装第三方库
pip国内镜像源

LaTeX-OCR是一个基于OCR技术的开源项目,旨在将LaTeX公式转换为电子文本。CSDN是中国最大的IT社区和技术知识分享平台。 LaTeX是一种常见的排版软件,主要用于科技论文、学术文章、书籍和报告的编写。它具有专业的排版效果和强大的数学公式编辑功能。然而,LaTeX语法相对复杂,对于不熟悉LaTeX的人来说,编辑和理解LaTeX公式可能会有一定的困难。 LaTeX-OCR项目的目标是利用OCR技术的优势,将印刷体的LaTeX公式转化为可编辑的电子文本。这个项目使用机器学习和计算机视觉算法,通过训练模型来自动识别LaTeX公式中的字符和结构,并将其转换为标准的LaTeX语法。这样,用户就可以通过扫描或拍照的方式将纸质文档中的LaTeX公式转换为可编辑的电子文本。 CSDN是中国IT技术社区的领导者,这个平台提供了丰富的技术文章、教程和在线问答。LaTeX-OCR项目在CSDN上发布了相关的教程和应用案例,帮助用户了解如何使用这个项目来解决LaTeX公式识别的问题。用户可以通过CSDN平台学习LaTeX-OCR的原理和使用方法,并与其他开发者交流经验和解决方案。 总之,LaTeX-OCR是一个将LaTeX公式转化为电子文本的开源项目,而CSDN是一个为技术爱好者提供知识分享和交流的平台。通过LaTeX-OCR项目和CSDN平台,用户可以更加方便地处理LaTeX公式,提高工作和学习的效率。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值