数据标注工具YEDDA

本文介绍了如何利用开源工具YEDDA进行数据标注,并针对其输出进行了BIO模式转换。重点讲述了环境配置、YEDDA运行流程及转换后的结果展示,同时分享了相关源代码链接。作者推荐YEDDA作为轻量级协作文本标注解决方案,尤其适合不想依赖复杂环境的开发者。
摘要由CSDN通过智能技术生成

数据标注

首先非常感谢YEDDA标注工具,这里提供了YEDDA的原版和中文版,都是github开源的,还有BIO转换文件的代码也是CSDN小力水手开源的。

所做工作

BIO转换将YEDDA输出的文件内容转换为BIO模式,适合了我们平时的数据标注模式。这里只对BIO转换文件做了些改进,使得运行更加通畅。

环境

  1. YEDDA原版: python 2.7
  2. YEDDA中文版: python 3.x

运行

  1. 首先运行YEDDA,注意YEDDA的输入文件格式
  2. 改 BIO转换.py 输入输出文件

结果展示

  1. YEDDA原版运行展示
    在这里插入图片描述
    导出前不小心删了几行,见谅。
  2. 导出后结果展示
    不小心删了几行
  3. 转换结果展示
    在这里插入图片描述

引用

@article{yang2017yedd

  • 12
    点赞
  • 53
    收藏
    觉得还不错? 一键收藏
  • 18
    评论
评论 18
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值