PyTorch在NLP任务中使用预训练词向量

最新推荐文章于 2024-05-03 20:11:46 发布

Douzi1024

最新推荐文章于 2024-05-03 20:11:46 发布

阅读量2k

点赞数

本文链接：https://blog.csdn.net/Xiao_CangTian/article/details/107573178

版权

1. 数据集

import numpy as np
import torch
from torch import nn, optim
from torchtext import data, datasets

import numpy as np
import torch
from torch import nn, optim
from torchtext import data, datasets

# use torchtext to load data, no need to download dataset
# set up fields
# 两个Field对象定义字段的处理方法（文本字段、标签字段）
TEXT = data.Field(tokenize='spacy')  # 分词
LABEL = data.LabelField(dtype=torch.float)

# make splits for data
# IMDB共50000影评，包含正面和负面两个类别。数据被前面的Field处理
# 按照(TEXT, LABEL) 分割成 训练集，测试集
train_data, test_data = datasets.IMDB.splits(TEXT, LABEL)

print('len of train data:', len(train_data))        # 25000
print('len of test data:', len(test_data))          # 25000

# torchtext.data.Example : 用来表示一个样本，数据+标签
print(train_data.examples[15].text)

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Douzi1024

关注关注

0
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
PyTorch在NLP任务中使用预训练词向量

1. 数据集import numpy as npimport torchfrom torch import nn, optimfrom torchtext import data, datasetsimport numpy as npimport torchfrom torch import nn, optimfrom torchtext import data, da...
复制链接

扫一扫