SCIERC数据集解析

SCIERC数据集专注于科学领域的知识图谱构建,包含六种实体类型和七种关系类型。数据集以clusters形式展示共指集群,详细解析包括sentences、ner和relations。实体类型如Task、Material等,关系类型如Used-for、HyponymOf等。每个条目提供实体和关系在句子中的位置信息,有助于理解科研文本中的信息结构。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

文章目录


官方数据集地址

Multi-Task Identification of Entities, Relations, and Coreference
for Scientific Knowledge Graph Construction

数据集样例

  • 六种实体类型
    • Task, Method, Metric,Material, Other-ScientificTerm and Generic
  • 七种关系类型
    • Compare, Part-of, Conjunction, Evaluate-for, Feature-of, Used-for, HyponymOf
{
   
  "clusters": [
    [
      [
        6,
        11
      ],
      [
        21,
        21
      ],
      [
        53,
        53
      ]
    ],
    [
      [
        15,
        16
      ],
      [
        69,
        69
      ],
      [
        94,
        94
      ]
    ],
    [
      [
        4,
        11
      ],
      [
        82,
        83
      ]
    ]
  ],
  "sentences": [
    [
      "This",
      "paper",
      "summarizes",
      "the",
      "formalism",
      "of",
      "Category",
      "Cooccurrence",
      "Restrictions",
      "-LRB-",
      "CCRs",
      "-RRB-",
      "and",
      "describes",
      "two",
      "parsing",
      "algorithms",
      "that",
      "interpret",
      "it",
      "."
    ],
    [
      
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值