2021SC@SDUSC
经过对无标签数据生成标签,我们合并有标签文本和无标签文本,和无标签的数据增强后的文本。
在训练阶段,我们从集合X中随机采样2个数据x,x‘,然后计算TMix(x,x’),和min(y,y’)
mixtext架构图
train.py 训练代码分析
读取数据集
train_labeled_set, train_unlabeled_set, val_set, test_set, n_labels = get_data(
args.data_path, args.n_labeled, args.un_labeled, model=args.model, train_aug=args.train_aug)
构建数据加载器
labeled_trainloader = Data.DataLoader(
dataset=train_labeled_set, batch_size=args.batch_size, shuffle=True)
unlabeled_trainloader = Data.DataLoader(
dataset=train_unlabeled_set