re这个库可以用来进行正则表达式,把句子里面乱七八糟没用的去掉 去除停用词可以用nltk里面的,也可以用网上常见的stopwords.txt 使用混淆矩阵图confusion_matrix(标签,预测值)