命名实体识别-序列标注
标签类型
进行命名实体识别时,通常对每个字进行标注。中文为单个字,英文为单词,空格分割。
标签类型一般如下:
类型 | 说明 |
---|
B | Begin,代表实体片段的开始 |
I | Internediate,代表实体片段的中间 |
E | End,代表实体片段的结束 |
S | Single,代表实体片段为单个字 |
O | Other,代表字符不为任何实体 |
标注类型
这里介绍比较常用的几种标注方式
BIO:标识实体的开始,中间部分和非实体部分
BIOS:增加S单个实体情况的标注
BIOSE:增加E实体的结束标识
标注demo
BIO标注&&BIOSE标注