Mixtext 代码分析

最新推荐文章于 2024-05-09 09:36:09 发布

IT_BD_Zhang

最新推荐文章于 2024-05-09 09:36:09 发布

阅读量1.2k

点赞数

分类专栏：软件工程应用与实践文章标签： python 深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_52073096/article/details/121600470

版权

MixText是一种半监督学习框架，核心是Tmix技术，用于同时处理有标签和无标签数据。文章介绍了如何使用Tmix进行半监督学习，包括对无标签数据的标签猜测和数据增强，以及熵最小化损失的使用。此外，详细讲解了forward()函数的实现，涉及relu、maxpooling和隐藏线性层的操作。

摘要由CSDN通过智能技术生成

2021SC@SDUSC

目录

TMix应用于半监督

forward() 函数实现

2021SC@SDUSC

我们启用一个新的名字MixText，MixText是一种半监督的框架。MixText的核心思想是使用Tmix同时在有标签和无标签数据上。

TMix应用于半监督

给定有限的数据集Xl={xl1,...,xln}，以及对应着的标签Yl={yl1,...,yln}，和大量的无标签的数据集Xu={xu1,...,xum}，其中yli∈{0,1}C，y是做了one-hot编码，C是y的类别数量，我们的目标利用有标签和无标签的数据训练一个分类器。

现在提出一个label guessing method，猜测标签的方法，在训练的时候对无标签数据进行生产标签，然后执行TMix训练，然后我们结合Tmix和额外的数据生成技术生成大量增强的数据，这是使我们算法效果好的一个关键步骤。最后，我们引入了熵最小化损失，使得模型在无标签的数据样本上获取较高的概率，在类别数C较大时也有助于提高性能。

经过对无标签数据生成标签，我们合并有

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Mixtext 代码分析

我们启用一个新的名字MixText，MixText是一种半监督的框架。MixText的核心思想是使用Tmix同时在有标签和无标签数据上。这节主要是讲TMix如何应用于半监督，给定有限的数据集Xl={xl1,...,xln}，以及对应着的标签Yl={yl1,...,yln}，和大量的无标签的数据集Xu={xu1,...,xum}，其中yli∈{0,1}C，y是做了one-hot编码，C是y的类别数量，我们的目标利用有标签和无标签的数据训练一个分类器。我们提出一个label guessing meth
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。