阿里中文预训练模型泛化能力挑战赛 Task2

2 篇文章 0 订阅

阿里中文预训练模型泛化能力挑战赛 Task2

Docker安装

可以看这里 有我的血泪史

运行过程

参考datawhale给的这篇

CUDA安装问题

看这篇血泪史

比赛改进思路

  • 修改 calculate_loss.py 改变loss的计算方式,从平衡子任务难度以及各子任务类别样本不均匀入手; 修改 net.py
    改变模型的结构,加入attention层,或者其他层; 使用 cleanlab 等工具对训练文本进行清洗;
    做文本数据增强,或者在预训练时候用其他数据集pretrain;
    对训练好的模型再在完整数据集(包括验证集和训练集)上用小的学习率训练一个epoch;
    调整bathSize和a_step,变更梯度累计的程度,当前是batchSize=16,a_step=16; 用
    chinese-roberta-wwm-ext 作为预训练模型;
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值