Re34:读论文 Organizing Portuguese Legal Documents through Topic Discovery

诸神缄默不语-个人CSDN博文目录

论文名称:Organizing Portuguese Legal Documents through Topic Discovery
论文下载地址:https://dl.acm.org/doi/abs/10.1145/3477495.3536329

本文是2022年SIGIR会议SIRIP(工业)track的paper,关注对法律文书的整理工作(整理、组织、摘要、发现隐主题),以巴西最高法院Jusbrasil的葡萄牙语数据集为例,进行主题建模,直接用术语表而非文档。

本文主要探索各种主题建模方法在葡萄牙语数据集上的效果(我咋感觉这个工作量不高呢,是我的错觉吗还是事实如此,SIGIR不是顶会吗,就这?)。

1. 主题建模方法

CombinedTM(CTM)
Top2Vec
BERTopic

2. 数据集和指标

数据集是2K+无标签文档,和425条有标签文档。

这里面介绍了一堆硬指标软指标什么的,感觉还挺复杂的,以后做相关领域了再慢慢看。

3. 实验结果

在这里插入图片描述

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

诸神缄默不语

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值