CROHME数据集详解

现对CROHME数据集的数据信息含义进行逐行讲解

目录

一、基本信息

1.1<ink xmlns>

1.2<traceFormat>

1.3<annotation>

1.4<annotationXML>

二、trace单条笔迹信息

三、traceGroup笔迹组合


一、基本信息

一个inkml文件开头会介绍部分作者信息:

1.1<ink xmlns>

表示遵守http://www.w3.org/2003/InkML的命名空间,类似于c++内的#including <iostream> using namespace std,作文档的规则声明。

1.2<traceFormat>

指定了笔迹数据包含手写笔画的 X 和 Y 坐标,都表示为十进制值。

1.3<annotation>

包含注释信息,age—年龄、gender—性别、hand—左右手、writer—作者、UI—文件名、copyright—版权。

重要的是type=true,表示这个注释记录了数学表达式的正确形式,$x^{2M}+x^{M-1}$表示公式的LaTeX格式。

1.4<annotationXML>

以XML的MathML 元素表示公式,type=true表示该公式的MathML的正确格式。

其中:

MathML主要格式
mro作为整体
msup上标
msub下标
mi字符
mn字母
mo操作数
mfrac分数
msqrt平方根
mroot任意方根

举例:

表示:x^{2M}

<xml:id>将作为被引用与后面相联系。

二、trace单条笔迹信息

每一个trace笔迹作为一个笔画被记录x与y的坐标,以逗号隔开,相应的id将在后面被引用

三、traceGroup笔迹组合

注释"Closest Strk" 代表了与数学表达式中的符号或运算符最相关的笔迹,当处理 $x^{2M} + x^{M-1}$ 这个手写表达式时, "Closest Strk" 注释可以帮助系统准确地将每个笔迹与表达式中的变量、指数、加号等元素进行关联,对于最终得到正确的数学公式非常关键。

<annotation type="truth">x</annotation>

表示该笔迹组合正确地表示x;

<traceView traceDataRef="0"/>

表示引用前面trace标记的id号为0的单条笔迹,在这里id为0和1的笔迹构成了x;

<annotationXML href="x_1">

表示该笔迹组合与前面的MathML的id为"x_1"相应对,是它的正确表示方式:

最终最大的traceGroup将所有笔记组合包括,形成整体的笔迹组合,即该inkml所表达的手写公式

  • 5
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值