# coding=utf-8
_author_ = 'liuzc'
# 导包
from sklearn.feature_extraction import DictVectorizer
def dictvec():
"""
字典数据抽取
"""
# 实例化 sparse=False 取消稀疏矩阵
dict = DictVectorizer(sparse=False)
#调用fit_transform
data = dict.fit_transform([{'name': '小明','age': 22}, {'name': '小花','age':60}, {'name': '小红','age': 30}])
#读取特征值
print(dict.get_feature_names())
# ['age', 'name=小明', 'name=小红', 'name=小花']
print(dict.inverse_transform(data))
print(data)
return None
if __name__ == "__main__":
dictvec()
打印结果:
['age', 'name=小明', 'name=小红', 'name=小花']
[{'age': 22.0, 'name=小明': 1.0}, {'age': 60.0, 'name=小花': 1.0}, {'age': 30.0, 'name=小红': 1.0}]
[[ 22. 1. 0. 0.]
[ 60. 0. 0. 1.]
[ 30. 0. 1. 0.]]