LaTeX-OCR安装教程

一. 通用安装步骤

1.前置应用

安装LaTeX-OCR首先需要安装Python。在系统自带的应用商店Microsoft Store搜索Python,点击最新版本Python 3.12下载即可。

2.运行powershell

Win11按底部状态栏windows徽标在搜索框内搜索 powershell 或者按快捷键 “win 键 + R” ,打开“运行”窗口,输入 powershell 并回车,打开命令行。

3.下载PyTorch

复制以下代码:pip3 install torch torchvision torchaudio -i https://pypi.tuna.tsinghua.edu.cn/simple some-package

在powershell中按鼠标右键粘贴键入内容,回车。

4.安装应用主体

复制以下代码:pip3 install pix2tex[gui] -i https://pypi.tuna.tsinghua.edu.cn/simple some-package

在powershell中按鼠标右键粘贴键入内容,回车。

5.启动应用

在powershell中键入latexocr并回车即可。

二. 问题汇总

1.Python库文件路径不在系统环境变量中

WARNING: The script isympy.exe is installed in 'C:\Users\19528\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.11_qbz5n2kfra8p0\LocalCache\local-packages\Python311\Scripts' which is not on PATH.
  Consider adding this directory to PATH or, if you prefer to suppress this warning, use --no-warn-script-location.

将Warning信息中的环境变量手动编辑进系统环境变量即可。

配置环境变量:

1、首先右击计算机进入属性然后选择其中的高级系统设置。(Win10)

在底部任务栏右键进入任务栏设置,选择系统-系统信息-高级系统设置(Win11)

在这里插入图片描述

 

 

2、点击进入高级中的环境变量,进入环境变量编辑界面。

在这里插入图片描述

3、在下方的系统变量中,双击打开path路径
添加python和python目录里的Scripts目录路径即可

用microsoft商店装的Python可以在参考这个目录:C:\Users\19528\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.11_qbz5n2kfra8p0\LocalCache\local-packages\Python311\Scripts

在这里插入图片描述

2.不支持长路径

ERROR: Could not install packages due to an OSError: [Errno 2] No such file or directory: 'C:\\Users\\19528\\AppData\\Local\\Packages\\PythonSoftwareFoundation.Python.3.11_qbz5n2kfra8p0\\LocalCache\\local-packages\\Python311\\site-packages\\transformers\\models\\deprecated\\trajectory_transformer\\convert_trajectory_transformer_original_pytorch_checkpoint_to_pytorch.py'
HINT: This error might have occurred since this system does not have Windows Long Path support enabled. You can find information on how to enable this at https://pip.pypa.io/warnings/enable-long-paths

这个错误信息表明安装包时发生了OSError错误,可能是因为没有启用Windows长路径支持。你可以参考https://pip.pypa.io/warnings/enable-long-paths上的说明来启用长路径支持。

根据Microsoft官网的方案,可以修改注册表或者直接在PowerShell用代码解决,代码如下:
New-ItemProperty -Path "HKLM:\SYSTEM\CurrentControlSet\Control\FileSystem" `
-Name "LongPathsEnabled" -Value 1 -PropertyType DWORD -Force

3.无法自动从github上下载训练数据weights.pth 

按照最后一步在powershell输入latexocr后输出:
download weights v0.0.1 to path C:\Users\19528\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.11_qbz5n2kfra8p0\LocalCache\local-packages\Python311\site-packages\pix2tex\model\checkpoints
Traceback (most recent call last):
...
 File "C:\Users\19528\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.11_qbz5n2kfra8p0\LocalCache\local-packages\Python311\site-packages\requests\adapters.py", line 517, in send
    raise SSLError(e, request=request)
requests.exceptions.SSLError: HTTPSConnectionPool(host='github.com', port=443): Max retries exceeded with url: /lukas-blecher/LaTeX-OCR/releases/download/v0.0.1/weights.pth (Caused by SSLError(SSLCertVerificationError(1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate (_ssl.c:1006)')))

可能是墙限制了对 GitHub 的访问。

解决方法:手动安装训练数据weights.pth

下载网址:

https://download.csdn.net/download/Andy_Xie007/88760727?spm=1001.2014.3001.5503

https://github.com/lukas-blecher/LaTeX-OCR/releases/download/v0.0.1/weights.pth(需要本地反代访问github)

安装位置:

在python环境变量路径(如C:\Users\19528\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.11_qbz5n2kfra8p0\LocalCache\local-packages\Python311)下搜索文件夹名称:checkpoints,将下载下来的weights.pth复制到搜索到的路径下,如

C:\Users\19528\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.11_qbz5n2kfra8p0\LocalCache\local-packages\Python311\site-packages\pix2tex\model\checkpoints(仅供参考)

详见https://www.yuucn.com/a/1548030.html(安装训练数据)

参考文章:

mathpix替代品-CSDN博客

[ 环境搭建篇 ] 安装python环境并配置环境变量(附python3.10.3安装包)_如何找到需要添加到环境变量的python-CSDN博客深度学习实战10-数学公式识别-将图片转换为Latex(img2Latex) - 电脑学习网

  • 27
    点赞
  • 34
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 3
    评论
LaTeX-OCR是一个基于OCR技术的开源项目,旨在将LaTeX公式转换为电子文本。CSDN是中国最大的IT社区和技术知识分享平台。 LaTeX是一种常见的排版软件,主要用于科技论文、学术文章、书籍和报告的编写。它具有专业的排版效果和强大的数学公式编辑功能。然而,LaTeX语法相对复杂,对于不熟悉LaTeX的人来说,编辑和理解LaTeX公式可能会有一定的困难。 LaTeX-OCR项目的目标是利用OCR技术的优势,将印刷体的LaTeX公式转化为可编辑的电子文本。这个项目使用机器学习和计算机视觉算法,通过训练模型来自动识别LaTeX公式中的字符和结构,并将其转换为标准的LaTeX语法。这样,用户就可以通过扫描或拍照的方式将纸质文档中的LaTeX公式转换为可编辑的电子文本。 CSDN是中国IT技术社区的领导者,这个平台提供了丰富的技术文章、教程和在线问答。LaTeX-OCR项目在CSDN上发布了相关的教程和应用案例,帮助用户了解如何使用这个项目来解决LaTeX公式识别的问题。用户可以通过CSDN平台学习LaTeX-OCR的原理和使用方法,并与其他开发者交流经验和解决方案。 总之,LaTeX-OCR是一个将LaTeX公式转化为电子文本的开源项目,而CSDN是一个为技术爱好者提供知识分享和交流的平台。通过LaTeX-OCR项目和CSDN平台,用户可以更加方便地处理LaTeX公式,提高工作和学习的效率。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Andy_Xie007

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值