修改自官方教程
对于中文文本,可以先用hanziconv把繁体转简体,英文转小写,再用结巴分词把句子转成词序列,根据词汇表转成词ID序列
这个模型我用来分类淘宝的好评、差评,正确率达到了88.7%
# -*- coding: utf-8 -*-
"""
tflearn教程,用LSTM循环神经网络分类文本
https://github.com/tflearn/tflearn/blob/master/examples/nlp/lstm.py
"""
import tflearn
from tflearn.data_utils import to_categorical, pad_sequences
from tflearn.datasets import imdb
# 词汇表词数
VOCAB_LEN = 10000