创建自己的Latex公式编辑器及AI自动识别

在线编辑器

链接如下:

Latex 在线公式编辑器

截图如下:
请添加图片描述
所有图标全是svg图片渲染,可以任意放大界面而不失真。

Flag

既然简单的界面已经做出来了,而且起的名字带有AI,想着怎么也不能对不起这两个字母,就个自己立了个flag,列了一个计划,真正用起AI,来帮助后来者,计划如下:

在这里插入图片描述
后期目标是,上传图片,然后识别返回生成的latex表达式;
但是能不能做到不太好说,由于资金有限,尤其最近显卡都炒到3倍了,本人现在自己台式机的显卡是GTX1060 6G,希望能支撑起模型的训练。

目标检测

初步计划用3个月的零碎时间,进行模型训练:1个月用于目标检测训练,2个月用于公式识别模型训练。

基本思路

  1. 要识别图片中的内容,第一步先要找到目标在哪里?因此准备从目标检测入手,采用yolo5方法。
    yolo5的简介可以看这篇文章:YOLOv5学习总结(持续更新)

  2. 训练模型需要数据,需要标记label等;
    用人标记,耗时耗力耗费,故准备采用代码自动数据,这种方法无法解决手写之类的识别,先这么着吧。

数据准备
yolo5训练

模型调用

web detector 发送base64 返回base64 web detector

数据准备

图片类似这样的:

在这里插入图片描述

每张图片对应一个文件,文件内部是一行行的label,label的格式如下:

object_class   x_center  y_center  width height

类别

初步定义的类别,如果不对再加:

类别Value例子
单行公式0文字 y = a x 2 + b x + c y=ax^2+bx+c y=ax2+bx+c文字
多行公式1文字 [ 1 2 3 4 ] \begin{bmatrix} 1 & 2\\ 3 & 4\end{bmatrix} [1324] 文字

初步结果

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

公式图片识别 生成Latex表达式

模型调用

web detector generator 发送base64 发送处理后的base64 或其它格式 返回Latex表示 返回Latex表示 web detector generator

识别模型的组成

图片
Encoder
Decoder
结果
  • Encoder使用CNN模型,用于提取图片特征
  • Decoder使用Sequence模型,用于将图片的Embedding转化为Latex表达式
  • 需要一个Latex的字典表
  • 图片处理:旋转、裁剪、翻转、模糊等

具体流程

  1. 数据集获取
  2. 从数据集中,总结字典,并在之后不断完善
  3. 图片加载,包括预处理(现在做)和数据增强(以后做)
  4. Encoder部分的代码
  5. Decoder部分的代码
  6. Loss部分
  7. inference部分(包括后处理)
  8. 服务部分
  9. beam search、rl(以后做)

未完,待更新…

想法来源

改用Markdown开始做笔记之后, 公式经常采用Latex书写,但是总是遇到一些公式不太会写,因此产生一个想法:

实现一个在线使用latex编辑公式的工具,工具提供帮助,不用记忆很多写法;利用端午节假期实现了一版。

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: LaTeX公式编辑器离线是指无需连接互联网,即可使用的编辑器。在没有网络条件或者需要在没有网络的环境下进行编辑时,离线编辑器非常方便。 使用离线的LaTeX公式编辑器,可以在电脑或移动设备上安装相关的软件或应用程序,并进行LaTeX公式的编辑和排版。离线编辑器通常包含了LaTeX语言的编辑和预览功能,用户可以通过输入LaTeX代码来插入各种符号、函数和公式,并实时预览编辑结果。用户还可以设置字体、大小和对齐方式等格式选项,以符合自己的需求。一些离线编辑器还支持手写输入,用户可以使用触摸屏或绘图板来绘制公式。 离线编辑器相比在线编辑器有许多优势。首先,离线编辑器无需依赖网络连接,当没有网络或者网络信号不稳定时也可以进行编辑工作。其次,离线编辑器通常具有更强大的功能和更高的性能,对于复杂的公式编辑更加方便和高效。同时,离线编辑器的安全性也更高,用户的相关数据不会被存储在云端,更加保护隐私。 总之,LaTeX公式编辑器的离线功能为用户提供了更加灵活和便捷的编辑环境,无论是在没有网络的情况下还是对性能和安全性有要求的用户都能够从中受益。使用离线编辑器,用户可以随时随地进行公式编辑,提高工作效率和方便性。 ### 回答2: LaTeX公式编辑器的离线功能指的是用户在没有网络连接的情况下也可以使用该编辑器来编辑和生成Latex公式。这个功能非常实用,因为有时候我们可能会在没有网络的环境中工作,或者有时候我们可能面临网络连接不稳定的情况。 离线功能使得用户可以在没有网络连接的情况下使用LaTeX编辑器打开已有的文件、编辑和保存文件。用户可以在离线模式下使用LaTeX编辑器的所有功能,包括创建、修改和预览LaTeX公式。当用户重新连接到网络时,编辑器可以将离线期间所做的更改同步到服务器上保存的文件中。 离线功能的实现主要依靠本地存储和同步机制。当用户首次使用LaTeX公式编辑器时,它会下载所需的文件和工具来实现离线编辑功能。编辑器会在本地保存用户所做的更改,并在重新连接到网络时将这些更改同步到服务器上。 此外,离线功能还提供了自动备份功能,可以在用户编辑公式时定期备份文件,以防止因为突发情况导致的丢失数据。 总而言之,LaTeX公式编辑器的离线功能使得用户可以在没有网络连接的情况下进行LaTeX公式编辑,保证了用户的工作效率和数据的安全。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值