我有两个目录,我想从中读取它们的文本文件并给它们贴上标签,但我不知道如何通过taggedDocument来实现这一点。我以为它可以作为标记文档([strings],[labels])工作,但这显然不起作用。
from gensim import models from gensim.models.doc2vec import TaggedDocument import utilities as util import os from sklearn import svm from nltk.tokenize import sent_tokenize CogPath = "./FixedCog/" NotCogPath = "./FixedNotCog/" SamplePath ="./Sample/" docs = [] tags = [] CogList = [p for p in os.listdir(CogPath) if p.endswith('.txt')] NotCogList = [p for p in os.listdir(NotCogPath) if p.endswith('.txt'