torchtext datasets总结

最新推荐文章于 2023-06-08 07:15:00 发布

大猛犸

最新推荐文章于 2023-06-08 07:15:00 发布

阅读量2.2k

点赞数

分类专栏： pytorch

本文链接：https://blog.csdn.net/zhaoyiwa/article/details/110467626

版权

综述

所有dataset继承自torchtext.data.Dataset,torchtext.data.Dataset继承自torch.utils.data.Dataset,他们都必须实现split和iters方法
approach1 splits:

# set up fields
TEXT = data.Field(lower=True, include_lengths=True, batch_first=True)
LABEL = data.Field(sequential=False)

# make splits for data
train, test = datasets.IMDB.splits(TEXT, LABEL)

# build the vocabulary
TEXT.build_vocab(train, vectors=GloVe(name='6B', dim=300))
LABEL.build_vocab(train)

# make iterator for splits
train_iter, test_iter = data.BucketIterator.splits(
    (train, test), batch_size=3, device=0)

approach2 iters:

# use default configurations
train_iter, test_iter = datasets.IMDB.iters(batch_size=4)

WikiText-2数据集

CLASStorchtext.datasets.WikiText2(path, text_field, newline_eos=True, encoding='utf-8', **kwargs)
</

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

大猛犸

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
torchtext datasets总结

综述所有dataset继承自torchtext.data.Dataset,torchtext.data.Dataset继承自torch.utils.data.Dataset,他们都必须实现split和iters方法approach1 splits:# set up fieldsTEXT = data.Field(lower=True, include_lengths=True, batch_first=True)LABEL = data.Field(sequential=False)# mak
复制链接

扫一扫