1. sklearn特征抽取
•sklearn.feature_extraction
作用:对字典数据进行特征值化 类:sklearn.feature_extraction.DictVectorizer
•
DictVectorizer
.
fit_transform
(X)
•
X:
字典或者包含
字典的迭代器
•
返回值:返回
sparse
矩阵
•
DictVectorizer
.
inverse_transform
(X)
•
X:array
数组或者
sparse
矩阵
•
返回值
:
转换之前数据格式
•
DictVectorizer.get_feature_names
()
•
返回类别名称
•
DictVectorizer.transform
(X)
•
按照原先的标准转换
作用:对文本数据进行特征值化
类:sklearn.feature_extraction.text.CountVectorizer
•
CountVectorizer
(
max_df
=1.0,min_df=1,
…
)
•
返回词频矩阵
•