Re14:读论文 ILLSI Interpretable Low-Resource Legal Decision Making

诸神缄默不语-个人CSDN博文目录

论文名称:Interpretable Low-Resource Legal Decision Making
论文ArXiv下载地址:https://arxiv.org/abs/2201.01164
论文AAAI官方下载地址:https://ojs.aaai.org/index.php/AAAI/article/view/21438/21187
论文官方GitHub项目,但是只放了README文件:RohanVB/Interpretable-Low-Resource-Legal-Decision-Making: Source code for paper “Interpretable Low-Resource Legal Decision Making”

本文是2022年AAAI论文。
本文的任务是输入案例事实描述文本,预测判决结果,即案例中提及的两个商标是否存在likelihood of confusion问题。
在这里插入图片描述

为了解决法律裁决任务中的可解释性问题,本文提出了预测中间标签的方法,并使用curriculum learning strategy解决了弱监督学习的问题,使模型可以利用到海量的仅用规则标注的noisy label的弱监督数据。

ILLSI这个模型简称是我编的。

1. Background

likelihood of confusion:新商标与旧已有商标太像,会引起混淆,所以不允许。

低资源:深度学习模型会对小样本标注数据表现好(我觉得怪怪的……):(1) 迁移学习+finetune(对超参敏感)(2) 弱监督或远程监督
在这里插入图片描述
在这里插入图片描述

可解释性

2. 数据集

(说要公布但是还没有公布)由两部分组成:

  1. 525个样本:有从5个角度来衡量相似性的中间标签。分成训练集/验证集/测试集。
    在这里插入图片描述
  2. 2852个样本:全都作为训练集。
    在这里插入图片描述
  3. augment:
    在这里插入图片描述
    我没有搞懂这个augment数据集的标签数据是怎么得来的,意思是跟clean数据中相似的句子有一样的中间标签?然后最后标签就直接求最大值?阈值是什么?我看跟人工筛选的规则也不一样啊,没有各feature之间的关联?

3. 模型

3.1 主模型

在这里插入图片描述
f 1 f_1 f1在端到端baseline上预训练(交叉熵)
f 2 f_2 f2在端到端baseline上预训练,损失函数:(Smooth L1 Loss:关注outliers)
在这里插入图片描述
E i n t e r n E_{intern} Eintern:transformer→前馈神经网络
融合:
在这里插入图片描述

3.2 curriculum learning

实现中间标签生成时使用的curriculum learning:
在这里插入图片描述

3.3 不做多任务范式的原因

在这里插入图片描述
(实验部分也拿多任务作为baseline了)

4. 实验

4.1 baseline:RoBERTa

  1. End-to-End在这里插入图片描述
  2. 多任务在这里插入图片描述

4.2 实验设置

超参数:
f 2 f_2 f2的β设为1
E i n t e r n E_{intern} Eintern隐藏层维度300(随便设的),transformer 6 layers with 6 heads,前馈维度512
batch size为8
一张 RTX 2080Ti machine with 11 GB of memory
curriculum learning的bins数为3(在calibration experiments中用5)
在这里插入图片描述

4.3 主实验结果

在这里插入图片描述
在这里插入图片描述

中间标签的预测结果:
在这里插入图片描述

4.4 Calibration(这一部分还没看懂)

Expected Calibration Error (ECE)

在这里插入图片描述

在这里插入图片描述

5. 文献阅读思考

不管怎么想我还是觉得这个任务应该用多模态范式来做,比如对比图片和发音。(我看到Analytics and EU Courts: The Case of Trademark Disputes这一篇真的用了CV,我心满离)

6. 代码复现

这数据集都没放出来,代码也没放出来,我issue提了也不回,复现个屁。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

诸神缄默不语

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值