生物领域的NER识别。
论文核心:提出了一种将多个模型做结合的一种方式,提高模型的预测性能。
针对每一种类型的实体,训练一个模型。解释是:每个模型是每种类型的专家,效果会很好。
每个实体类型的模型训练架构
模型的结合方式
aggregation operation such as max pooling or concatenation.
现在每种类型的数据集上,单独训练,形成针对每种类型的初始模型。(CRF模型)
在之后的阶段中,利用之前所有的训练模型,具体来说,当选择target=d的模型时,选择对应的在该数据集上训练的模型为target model,其余model为协作模型collaboration model。
我理解的哈:
是将每个target data中的sent,采用协作模型得到表示的前提下,利用某种方式(比如,maxpool or concatenation等等方法,集成多个结果),之后,在和target model 得到的句子表示做集成,作为最终的表示,在喂给target model得到新的CRF的表示,通过loss更新模型参数,得到新的更新后训练的target model。
总结
模型的集成方式的探讨,但缺陷也明显,内存大,应用不方便,在实际中应用价值不高。
但可以作为性能改善提升的一种方式。