[论文笔记]FiNER:金融NER数据集

Source

Title

FiNER: Financial Named Entity Recognition Dataset and Weak-Supervision Model

URL: https://arxiv.org/pdf/2302.11157.pdf

Authors & Affiliation

Agam Shah等,Georgia Institute of Technology

一作为Computing PhD, 二作及以后来自school of business

Publication

ACM SIGIR ’23: The 46th International ACM SIGIR Conference on Research and Development in Information Retrieval

Abstract

Contribution

  1. 数据集

  1. Extending Snorkel’s existing weak-supervision framework for span-level labeling. 好像是用于生成标注数据

FiNER-ORD

金融新闻文章,人力标注(可能存在标注错误,需要处理)

数量:47,851条

来源:webz.io (https://webz.io/free-datasets/financial-news-articles/

标注工具:https://github.com/doccano/doccano

entity label: LOC,PER和ORG

问题:

  1. 有效样本数目太小

训练集中entity数仅83,测试集中79,验证集中仅4

  1. 人工标注错误

  1. entity类别有限

仅 LOC,PER和ORG三种

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值