bert模型可以做文本主题识别吗_文本匹配方法系列––BERT匹配模型

最新推荐文章于 2023-10-30 11:11:06 发布

抹韵

最新推荐文章于 2023-10-30 11:11:06 发布

阅读量800

点赞数 1

文章标签： bert模型可以做文本主题识别吗

本文链接：https://blog.csdn.net/weixin_34413326/article/details/112812978

版权

本文介绍了BERT模型如何用于文本匹配任务，阐述了BERT的预训练和微调阶段，以及在工业应用场景中的优势。BERT模型凭借其在Next Sentence Prediction任务中的能力，能有效处理文本匹配，通常能达到80%以上的准确率，适合工业级应用。

摘要由CSDN通过智能技术生成

1、概述

在介绍深层次交互匹配方法之前，本文接着多语义匹配方法[1]介绍基于BERT模型实现文本匹配的方法。将其单独介绍主要因为BERT实现文本匹配操作方便且效果优秀，比较适用于工业应用场景。关于bert模型,Devlin, J., Chang, M. W., Lee, K., & Toutanova, K. (2018)[2]在论文中有较为详细的介绍，官方代码可以在以下GitHub网址中找到：https://github.com/google-research/bert[3]。

2、模型&实践

2.1 BERT模型介绍

BERT本质上是一个两段式的NLP模型。第一个阶段叫做：Pre-training，通过大规模无监督预料训练获得的模型，可以获取文本动态字符级语义embedding，简单地可以视为加强版的字符级word2vec。实际上由于bert预训练阶段在Masked LM之外的另一个pre-training任务就是Next Sentence Prediction，即成对句子构成的句子级问题，所以用BERT做文本匹配是有天然优势的。

第二个阶段叫做：Fine-tuning，利用预训练好的语言模型，完成具体的NLP下游任务，NLP下游任务下游任务多种多样，NLP在多种任务中当时都取得了SOTA的效果，其中之一就是文本匹配任务，只需要直接输入分割好的句子对就可以直接获取匹配结果。

当然除了直接使用bert的句对匹配之外，理论上还可以只用bert来对每个句子求embedding，之后再通过向Siamese Network这样的经典模式去求相似度也可以。但从实操来说是不可取的，使用bert获取embedding后再去接复杂的交互计算，整个模型会非常大，训练时耗也会很长࿰