- 流水线式(Pipeline)方法:关系分类和实体抽取分成两个任务进行,分别计算loss,不互相影响
- 模型训练简单,为常规NLP下游任务:分类和序列标注;
- 预测速度慢,需要同时输入两个模型;
- 因为模型预测误差,容易出现非法的二元组,如:
(周星驰,上映时间)
,需要执行关系链接操作;
- 联合式(Joint)方法:关系分类和实体抽取采用同一个公共Embedding层进行编码,并采用multi-task的处理方式计算loss,互相影响
- 模型训练困难,两类下游任务的loss及梯度下降速度均不在一个量级上;
- 预测速度快,仅通过单模型即可获得两个下游任务的输出;
- 公共Embedding层编码共用信息的情况下,极少出现非法二元组,避免后续再执行关系链接的操作。
基于知识图谱的问答——模型结构
最新推荐文章于 2024-01-13 14:41:02 发布