我刚开始使用OpenNLP.我需要创建一个简单的训练模型来识别名称实体.
Pierre Vinken , 61 years old , will join the board as a nonexecutive director Nov. 29 .
Mr . Vinken is chairman of Elsevier N.V. , the Dutch publishing group .
Rudolph Agnew , 55 years old and former chairman of Consolidated Gold Fields PLC ,
was named a director of this British industrial conglomerate .
问题是两个:
>为什么我必须把这些人的名字放在一个文本(短语)的上下文中?为什么每行不写一个人的名字?喜欢:
Robert
Maria
John
>如何添加额外的信息到该名称?
例如我想保存每个名字的男/女信息.
(我知道有些系统试图理解它读最后一封信,如“a”为女等,但我想自己添加)
谢谢.