【Ditto】Deep Entity Matching with Pre-Trained Language Models
论文提出了一种基于预训练Transformer语言模型的实体匹配系统。实验表明,在大型文本语料库上预训练的语言模型(如BERT、DistilBERT或RoBERTa)的直接应用已经显著提高了匹配质量,并超过了之前最好的表现,在基准数据集上f1scoref1score提升了高达29%。文中还提出了三种优化技术来进一步提高Ditto的匹配能力。另外还发现ditto最多用以前一半的标记数据就可以实现以前的SOTA结果。
原创
2023-03-07 16:52:00 ·
339 阅读 ·
0 评论