首先抓取好评或者差评的数据集
# load dataset
TEXT = data.Field(tokenize='spacy')
LABEL=data.LabelField(dtype=torch.float)
'''
IMDB来自torch test,用来提取文件中相关的文件和数据,比如test和label
test是一个list,包含评论本身的内容,相当于x,此时x是str类型,必须embedding一下,才可以用
label是一个pos的值,相当于y
'''
train_data,test_data=datasets.IMDB.splits(TEXT,LABEL)
print('len of train data:',len(train_data))
print('len of test data:',len(test_data))
# 输出
# len of train data:25000
# len of test data:25000
print(train_data.examples[15].text)
print(train_data.examples[15].label)
网络结构
embedding初始化的例子
embedding层会生成一个表,如下