直接上代码,然后就着代码分析
>>> from sklearn.feature_extraction import DictVectorizer
>>> v = DictVectorizer(sparse=False)
>>> D = [{'性别': '男', '年龄': 2}, {'性别': '女', '年龄': 23}]
>>> X = v.fit_transform(D)
>>> X
array([[ 2., 0., 1.],
[23., 1., 0.]])
>>> v.inverse_transform(X) == [{'年龄': 2.0, '性别=男': 1.0},
... {'年龄': 23.0, '性别=女': 1.0}]
>>> v.transform({'性别': '男', '年龄': 267})
array([[267., 0., 1.]])
代码中的D是字典类型的特征数据,sparse=False
表示输出的不是稀疏矩阵。