TimeML: Robust Specification of Event and Temporal Expressions in Text
1. TimeML 简介
TimeML规范,是在自然语言文本中表示事件和时间表达式的一种规范语言,是为了提升自然语言问答系统的处理性能而提出的,现已成为事件时间表达式的一种ISO标准规范。
TimeML是在一个关于问答系统的AQUAINT项目中被提出来的,经历了3次专题研讨会的讨论和确定。
- 第一次是TERQAS,研究者们以提高自然语言问答系统的性能,以便处理新闻文章中基于时间问题的事件为目的,在这次会议上第一次定义了TimeML标准并且创建了相应英文文本语料库TimeBank。
- 第二次是TANGO,发布了界面化的标注工具。
- 第三次是TARSQI,参与者们开发了在自然语言文本中表示事件和时间表达式的算法,并利用TimeML标准进行了相关英文文本解析试验。
它被设计来解决以下四个问题:
- 事件的时间标记;
- 事件之间的相互顺序;
- 根据上下文交代的特定时间表达式对事件进行推理;
- 推理事件的持续时间。
TimeML将事件定义为事件时间关系网中的一个节点,用时间信息来标记和索引事件,从而进行事件在时间方面的推理工作。
2. TimeML 标注规则及示例
TimeML标注形式:先将待标注文本组织成XML形式,然后使用不同的标签来表示不同元素类别,从而进行文本标注。
在TimeML中使用的标签主要有:EVENT、SIGNAL、TIMEX3、MAKEINSTANCE、LINKS。
- EVENT标签:来标注“事件”类型的元素,事件是涵盖“发生”情况的术语,可以是瞬时事件,也可以是持续事件。从语言学角度看事件可以是动词、名词、形容词等。
- SIGNAL标签:标注存在于事件对之间、时间对之间、时间和事件之间的具体关系。
- TIMEX3标签:标注时间表达式。
- MAKEINSTANCE标签:详细描述一个事件的具体实例。
- LINKS标签:有三种类型TLINK(Temporal Link)、SLINK(Subordination Link)、ALINL(Aspectual Link)。
TLINK描述事件之间、时间之间或者时间和事件之间的时序关系;SLINK描述文本中两个事件的关系;SLINK描述一个体态事件和另一个事件之间的关联。
EVENT标签的BNF形式如下:

SIGNAL标签的BNF形式如下:

TIMEX3标签的BNF形式如下:

EVENT、SIGNAL、TIMEX3三个标签应用示例:
John left 2 days before the attack.
John
<EVENT eid="e1" class="OCCURRENCE" tense="PAST" aspect="PERFECTIVE">
left
</EVENT>
<MAKEINSTANCE eiid="ei1" eventID="e1"/>
<TIMEX3 tid="t1" type="DURATION" value="P2D" temporalFunction="false">
2 days
</TIMEX3>
<SIGNAL sid="s1">
before
</SIGNAL>
the
<EVENT eid="e2" class="OCCURRENCE" tense="NONE" aspect="NONE">
attack
</EVENT>
<MAKEINSTANCE eiid="ei2" eventID="e2"/>
TLINK标签的BNF形式如下:

TimeML是一种规范语言,用于在自然语言文本中表示事件和时间表达式,主要应用于提升问答系统的性能。起源于AQUAINT项目,经过TERQAS、TANGO和TARSQI三次研讨会发展和完善。TimeML涵盖了事件时间标记、事件顺序、时间推理和事件持续时间的推理。它使用EVENT、SIGNAL、TIMEX3、MAKEINSTANCE和LINKS等标签进行文本标注,促进了英文和中文文本中事件时间关系的研究和发展。
最低0.47元/天 解锁文章
6370

被折叠的 条评论
为什么被折叠?



