本文描述一下特征工程,主要包含以下几个方面:
- 特征抽取
- 特征预处理
- 特征降维
1、特征抽取
- 特征抽取的API :sklearn.feature_extraction
- 字典特征抽取:
类:sklearn.feature_extraction.DictVectorizer
语法结构:
·····DictVectorizer(sparse=True,…)
方法:
①DictVectorizer.fit_transform(X)
X:
字典或者包含
字典的迭代器
返回值:返回
sparse
矩阵
②DictVectorizer
.
inverse_transform
(X)
X:array