ACE 2005多语种训练语料库

ACE 2005多语种训练语料库
项目名: ACE 2005多语种训练语料库

介绍
ACE 2005多语言培训语料库包含用于2005年自动内容提取(ACE)技术评估的全套英语,阿拉伯语和中文培训数据。语料库由语言数据协会(LDC)在ACE计划的支持下以及LDC的额外协助下,为实体,关系和事件标注的各种类型的数据组成。

ACE程序的目标是开发自动内容提取技术,以支持文本形式的人类语言的自动处理。

2005年11月,对站点的五个主要方面的系统性能进行了评估:实体,价值,时间表达,关系和事件的识别。实体,关系和事件提及检测也作为诊断任务提供。除事件任务外,所有任务均以英语,中文和阿拉伯语三种语言执行。活动任务仅以英文和中文进行评估。此版本包含这些评估任务的官方培训数据。

有关ACE计划语言资源的更多信息,包括注释准则,任务定义和其他文档,请访问LDC的ACE网站。

数据
以下是有关此版本中的数据量及其注释状态的信息。

1P:数据需经过第一遍(完整)注释
DUAL:数据还必须经过双重首次通过(完整)注释
ADJ:数据也会受到差异解决/裁决的影响
NORM:数据也要经过TIMEX2规范化
详见链接: link.

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值