在处理nlp数据时,通常将文本处理成词在字典中的序号组成的序列,在tensorflow中直接使用下面的函数
from tensorflow.contrib import learn
#加载模型,利用训练语料形成的字典
vocab_processor=learn.preprocessing.VocabularyProcessor.restore('vocab')
vocab_processor=learn.preprocessing.VocabularyProcessor(max_document_length=mean_document_length,min_frequency=5)
x=np.array(list(vocab_processor.fit_transform(x_text)))