学术垃圾-文本分类

文本分类的训练、推理

基于transformers包,huggingface的社区,streamlit的界面。简单记录当前的内容。

文本分类训练的说明

在这里插入图片描述
在这里插入图片描述

文本分类训练

在这里插入图片描述
训练标签与ID的对应关系和训练进度条的展示,保存最佳模型,用于后续的推理。
在这里插入图片描述
精度折线图和精度
在这里插入图片描述

文本分类推理

输出分类结果类别以及名称
在这里插入图片描述

PLAN迭代训练

  1. 使用小量数据训练模型,得到初始模型A
  2. 使用模型A,对数据进行标注,标注时使用阈值筛选分数较大的部分,这部分简单做了个实验,简单证明了一下可行性。阈值从0到0.9的效果,一个是分数一个是数量。
    在这里插入图片描述
    在这里插入图片描述
  3. 对新数据进行筛选与数据标注,使用模型A,设置阈值进行标注,整体基于前面保存的模型地址。
    在这里插入图片描述
    在这里插入图片描述
  4. 重新对模型A训练,方式待定(得学一下半监督学习了),得到模型B。
  5. 使用模型B再反复进行以上的操作
  • 11
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值