实体解析(ER)是数据集成的核心问题,又称为实体匹配(Entity Matching)。如下图所示,是指从给定的两张关系表中找出所有代表相同实体的元组,此例中有两对实体相同。
经典研究方法
近年来,经典的实体解析方法:
1、DeepER方法
2、DeepMatcher方法:Deep Learning for Entity Matching: A Design Space Exploration
代码仓库:https://github.com/anhaidgroup/deepmatcher?tab=readme-ov-file
3、Ditto方法:Deep Entity Matching with Pre-Trained Language Models
代码仓库:https://github.com/megagonlabs/ditto
4、HierGAT方法
5、DADER方法
6、Rotom方法
7、JointBert方法
中文社区里面,相关的资料比较少,方便大家交流,建了一个Q群:749888297
当前研究热点
1、异构实体解析
2、广义实体解析、跨模态实体解析
3、实体解析中的隐私保护