tBERT: Topic Models and BERT Joining Forces论文学习

最新推荐文章于 2024-06-16 09:34:14 发布

HxShine

最新推荐文章于 2024-06-16 09:34:14 发布

阅读量642

点赞数

分类专栏： nlp_paper nlp学习 nlp 文章标签： tbert 文本匹配

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_16949707/article/details/118418711

版权

nlp 同时被 3 个专栏收录

97 篇文章 3 订阅

订阅专栏

75 篇文章 7 订阅

订阅专栏

61 篇文章 2 订阅

订阅专栏

一、概览

在这里插入图片描述

二、论文解读

abstract

如何结合topic和预训练模型？
提出了新的架构来做pairwise的语义相似度检测
发现topics极大地帮助解决领域知识的问题

1.introduction

预训练模型建立了新的一个王国
paraphrase的检测提升比较大，semantic similarity detection还是个挑战，例如社区问答项目，需要衡量question-answer对之间的关系，因为高度领域相关，所以还是比较有挑战。
topic models提供了额外领域相关的语义的信息来做语义相似度计算

2. 数据集

3.tBERT

3.1 结构
bert cls特征+主题模型特征
主体模型实验：
LDA + GSDMM
结合字和文档级别的主体
每个tokens都放到topic model里面去

就两个句子的每个token都过一下topic model，然后取平均值。
在这里插入图片描述

3.2 主体模型选择
主题个数:70-90
alpha值：1或者10
LDA：
不适合短文本
GSDMM：
基于word和基于documnet都试了
指标是f1
3.3 不同baseline比较

感觉没提升多少啊，semeval数据集提升多一点
收敛的更快

在这里插入图片描述

ps：领域知识在机器翻译，命名实体识别提升也比较大。
就这也可以acl吗?看起来好简单啊

english

The task is to predict whether two questions are paraphrases.->任务是预测两个问题是否是转述。
Jensen- Shannon divergence -> 詹森-香农散度

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
3
评论
tBERT: Topic Models and BERT Joining Forces论文学习

一、概览二、论文解读abstract如何结合topic和预训练模型？提出了新的架构来做pairwise的语义相似度检测发现topics极大地帮助解决领域知识的问题1.introduction预训练模型建立了新的一个王国paraphrase的检测提升比较大，semantic similarity detection还是个挑战，例如社区问答项目，需要衡量question-answer对之间的关系，因为高度领域相关，所以还是比较有挑战。topic models提供了额外领域相关的语义的信息来做
复制链接

扫一扫

专栏目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。