知识图到文本的生成(六)

本文详细分析了数据迭代和数据集产生的代码,包括使用`TabularDataset`处理CSV/TSV数据,构建训练集和验证集迭代器,并对测试集进行处理。`mkiters`函数中,数据被转换并构造了图,通过`data.Iterator`生成训练和验证迭代器。在`mktestset`函数中,对测试数据进行了预处理,用于模型的测试迭代。
摘要由CSDN通过智能技术生成

2021SC@SDUSC 

本文将就数据迭代部分和数据集产生部分的代码进行详细分析

 

首先我们对mkiters函数进行分析,详细分析如下 

    args = self.args
    train = data.TabularDataset(path=args.path, format='tsv',fields=self.fields)
    self.trainsize = len(train.examples)
    valid = data.TabularDataset(path=args.path.replace("train","val"), format='tsv',fields=self.fields)

 如同在第二篇博客中提到的,self是该类的一个实例,第二个args为自由参数。将实例赋予我们定义好的参数args,并定义一个局部变量train表示,TabularDataset用于定义一个csv,tsv或json格式的数据集,设置路径为args.path,格式为tsv格式,对于不需要的列field传递 为None ,若数据有列名,需设置skip_header=True,否

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值