学术垃圾-文本分类

sonwing

已于 2024-04-21 22:12:03 修改

阅读量369

点赞数 11

文章标签：分类数据挖掘人工智能

于 2024-04-21 13:03:04 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sonwing/article/details/138030352

版权

文本分类的训练、推理

基于transformers包，huggingface的社区，streamlit的界面。简单记录当前的内容。

文本分类训练的说明

在这里插入图片描述

文本分类训练

在这里插入图片描述
训练标签与ID的对应关系和训练进度条的展示，保存最佳模型，用于后续的推理。

精度折线图和精度

文本分类推理

输出分类结果类别以及名称
在这里插入图片描述

PLAN迭代训练

使用小量数据训练模型，得到初始模型A
使用模型A，对数据进行标注，标注时使用阈值筛选分数较大的部分，这部分简单做了个实验，简单证明了一下可行性。阈值从0到0.9的效果，一个是分数一个是数量。
对新数据进行筛选与数据标注，使用模型A，设置阈值进行标注，整体基于前面保存的模型地址。
重新对模型A训练，方式待定（得学一下半监督学习了），得到模型B。
使用模型B再反复进行以上的操作

关注

11
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
学术垃圾-文本分类

基于transformers包，huggingface的社区，streamlit的界面。简单记录当前的内容。训练标签与ID的对应关系和训练进度条的展示，保存最佳模型，用于后续的推理。输出分类结果类别以及名称。
复制链接

扫一扫

sonwing CSDN认证博客专家 CSDN认证企业博客

码龄7年

40: 原创

11万+: 周排名

5万+: 总排名

6万+: 访问

: 等级

826: 积分

31: 粉丝

78: 获赞

35: 评论

182: 收藏

私信

关注

热门文章

分类专栏

姿态估计 1篇
python 5篇
学习日志 2篇
docker 3篇
计算机网络 2篇
git 1篇
vbs 2篇
centos 5篇
matlab 1篇
gcc 1篇
anaconda 2篇
知识图谱 1篇
windows 3篇
阿里云服务器 2篇
ubuntu 4篇
hadoop 1篇
mysql 2篇
oracle 1篇
CTF-web 1篇
tomcat 2篇

最新评论

学术垃圾-文本分类
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
jupyterlab的简单使用
普通网友: 写的很好！我也写了一篇获取【大厂面试真题解析、核心开发学习笔记、最新全套讲解视频、实战项目源码讲义、学习路线简历模板】的文章
pycharm添加运行参数（sys.argv[1]）
sonwing: 路径直接加进去就行，不用加引号。最后一个图里alphanli/就是路径
pycharm添加运行参数（sys.argv[1]）
椿花湫月760: 添加完参数后显示No such file or directory是什么情况
pycharm添加运行参数（sys.argv[1]）
椿花湫月760: 作者您好，请问参数后面的路径怎么填写

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。