sklearn.feature_extraction.text.CountVectorizer(stop_words=[])
stop_words是停用词,即不作为计数对象
1、作用:对文本特征数据进行特征值化
2、X是文本或包含文本字符串的可迭代对象,返回值:返回sparse矩阵(对重复词进行计数)
CountVectorizer.fit_transform(X)
3、返回单词列表
CountVectorizer.get_feature_names()
4、toarray()方法可以返回行列矩阵的形式