人工标注
一、语义角色:
-
Agent:实施动作的主体
-
Action:谓语,动作
-
Patient:承受动作的客体
-
Time:发生动作的时间
-
Location:发生动作的地点
二、工具——label studio
官方网址:Open Source Data Labeling | Label Studio
使用工具:label studio
安装命令:pip install label-studio
启动命令:label-studio
访问API:http://localhost:8080
使用流程——关系抽取项目:
-
新建项目
-
输入 Project Name
-
输入 Description(可省略)
-
Labeling Setup栏目
选择自己需要的模块,这里选择Relation Extraction
-
Natural Language Processing
-
Relation Extraction
-
add Label Name
-
Data Import
-
Data Import栏目
-
导入要标注的数据文件.txt
-
可以单击选择文件打开,也可以将文件拖入浏览器
上述设置也可以在直接创建项目后的Settings中进行设置
projects / 测试项目 / Settings
General:设置项目名称和简述
Labeling Interface:
Browse Templates:选择模板
Add label names:添加标签
Labels:设置标签颜色,删除标签
可以在项目中的Import导入新的需要标注的数据文件
Projects / 测试项目 / Labeling
-
选择任务
-
选择标签,对对应标签的数据进行拖选
-
Submit\Update
-
导出文件
projects / 测试项目