离线LaTex公式识别V1.0开发

离线LaTex公式识别V1.0开发

前期的工作

请看博文-离线LaTex公式识别V0.9开发

已完成的内容

  • LaTex公式识别的GUI。
  • 支持将LaTex复制为MathML。
  • 支持读取剪切板的图片。

部分UI换成iconfont下载的一些元素。

读懂pyqt的一些代码。基本实现了万能君的软件库的所有功能。

开发过程暂时告一段落。

主要添加的代码

初始化方面

        # 初始化剪切板监听  
        self.clipboard = QApplication.clipboard()
        # 初始化剪切板监听(默认不开启)  
        self.clipboard.dataChanged.connect(self.on_clipboard_data_changed)  
       
        self.tempField.setRange(0, 1)
        self.tempField.setSingleStep(0.1)
        self.checkbox = QCheckBox("Enable listening to clipboard | 使能读取剪切板", self)
        self.checkbox.setChecked(True)  # 设置初始状态为选中  
        self.checkbox.stateChanged.connect(self.on_checkbox_change)
        # Create retry button
        self.MathMLButton = QPushButton('LaTex2MathML|复制为MathML', self)
        self.MathMLButton.setEnabled(False)
        # self.MathMLButton.clicked.connect(self.returnSnip)
        self.MathMLButton.clicked.connect(self.mathml)


        # Create LaTex button
        self.LaTexButton = QPushButton('LaTex_Copy|复制为LaTex', self)
        self.LaTexButton.setEnabled(False)
        self.LaTexButton.clicked.connect(self.latex)

函数方面:



    def on_checkbox_change(self, state):

        if self.checkbox.isChecked():
            self.clipboard.dataChanged.connect(self.on_clipboard_data_changed)
        else:
            self.clipboard.dataChanged.disconnect(self.on_clipboard_data_changed)   

    def on_clipboard_data_changed(self):  
 
        # 检查剪切板中是否有图像数据  
        clipboard = QApplication.clipboard()  
        mime_data = clipboard.mimeData()  
        if mime_data.hasImage():  
            # 从剪切板获取图像数据  
            qimage = mime_data.imageData()  
            img = Image.fromqimage(qimage)
            # img = ImageQt.fromqimage(qimage)
            self.img = img
            self.returnSnip(self.img)
    @pyqtSlot()
    def mathml(self):
        math = latex2mathml.converter.convert(self.text)
        pp.copy(math)
    @pyqtSlot()
    def latex(self):
        result = self.text
        pp.copy(result)

GitHub工程见Pix2Text-GUI

删除内容

公式识别软件,不是刚需,之前的版本占用了8G的内存,其中torch占用3个G(GPU版本),模型2个多G、属实是本末倒置。因此本版本删除了Nougat、Texify,以节约工具占用的存储空间。

尽管Pix2Text在印刷体的识别精度某些程度上是不如Nougat、Texify的,但是它支持手写体公式的识别,此外模型也是比较小的,不到200MB。

经过瘦身后的工具占用空间1.2G。

在这里插入图片描述

尽量的在瘦身。

使用案例

印刷体

在这里插入图片描述

手写公式

在这里插入图片描述

下载地址

链接:https://pan.quark.cn/s/4f49a9abaa85
提取码:UvM1

  • 7
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
LaTeX是一种常用于撰写科技文档和数学公式的标记语言,而离线数学公式编辑器则是一种能够在没有网络连接的情况下进行 LaTeX 数学公式编辑的工具。 离线数学公式编辑器通常具有以下特点: 1. 安装:离线数学公式编辑器需要在计算机上进行安装。安装完成后,用户可以随时运行该软件进行数学公式的编辑工作。 2. 功能:离线数学公式编辑器提供了丰富的功能,用户可以通过简单的操作完成复杂的数学公式编写。例如,用户可以选择不同的字体、样式、大小和颜色来渲染公式,并可以添加各种符号、表达式等。 3. 实时预览:离线数学公式编辑器通常具有实时预览功能,用户编辑公式时,可以即时看到编辑结果。这使得用户可以更加方便地进行公式的调整和修改。 4. 导出:离线数学公式编辑器支持将编辑好的数学公式导出为各种格式,如PDF、PNG、SVG等。这样,用户可以将公式插入到其他文档中,或者打印出来作为参考。 5. 自动保存:离线数学公式编辑器通常具有自动保存功能,以防止意外丢失用户的编辑内容。即使在没有网络连接的情况下,用户的编辑工作也会被保存在本地计算机上。 总之,离线数学公式编辑器是一种方便实用的工具,可以在没有网络连接的情况下进行数学公式的编辑和处理。它是学术界和科研人员常用的一种工具,能够提高文档的质量和效率。
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值