每天一遍,学习不厌 nltk分类器 nltk提供了朴素贝叶斯分类器方便的处理自然语言相关的分类问题,并且可以自动处理词袋,完成IFIDF矩阵的整理,完成模型训练,最终实现类别预测。使用方法如下: import nltk.classify as cf import nltk.classify.util as cu ''' 列表中一个元组,元组中包含输入和输出数据,输入是字典,表示age出现15次。最后一位是类别标签。 train_data的格式不再是样本矩阵,nltk要求的数据格式如下: [ ({'