利用TfidfVectorizer+朴素贝叶斯进行文本分类
处理流程一般为:
提取特征数据集 标签 并向量化
选择合适的分类器构建模型
对模型进行验证
案例:
from sklearn.datasets import fetch_20newsgroups
from sklearn.cross_validation import cross_val_score
from sklearn.feature_extract...
原创
2018-08-06 08:13:47 ·
5063 阅读 ·
0 评论