BIO标注法:
B-begin,代表实体的开头
I-inside,代表实体的中间或结尾
O-outside,代表不属于实体
BIOES标注法:
B-begin,代表实体的开头
I-inside,代表实体的中间
O-outside,代表非实体,用于标记无关字符
E-end,代表实体的结尾
S-single,代表单个字符,本身就是一个实体
BIO标注举例
比如,我们将 X 表示为名词短语(Noun Phrase, NP),则BIO的三个标记为:
(1)B-NP:名词短语的开头
(2)I-NP:名词短语的中间
(3)O:不是名词短语
因此可以将一段话划分为如下结果;
我们可以进一步将BIO应用到NER中,来定义所有的命名实体(人名、组织名、地点、时间等),那么我们会有许多 B 和 I 的类别,如 B-PERS、I-PERS、B-ORG、I-ORG等。然后可以得到以下结果: