sklearn-特征提升之特征提取-----DictVectorizer

最新推荐文章于 2020-08-15 17:53:30 发布

2h4n9y1m1n9

最新推荐文章于 2020-08-15 17:53:30 发布

阅读量684

点赞数

分类专栏：数据分析处理文章标签：数据预处理

本文链接：https://blog.csdn.net/qq_37249672/article/details/97129279

版权

数据分析处理专栏收录该内容

2 篇文章 0 订阅

订阅专栏

DictVectorizer的处理对象时符号化（非数字化）的但是具有一定结构的特征数据，如字典等，将符号转成数字0/1表示。

test_dict = [{'name':'zhang','old':23},{'name':'wang','old':15},{'name':'liu','old':33}]

from sklearn.feature_extraction import DictVectorizer

#输出转化后的特征矩阵
print(vec.fit_transform(measurements).toarray())
#输出各个维度的特征含义
print(vec.get_feature_names())

[[ 0.  0.  1. 23.]
 [ 0.  1.  0. 15.]
 [ 1.  0.  0. 33.]]

['name=liu', 'name=wang', 'name=zhang', 'old']

原本的test_dict数据为：

name	old
zhang	23
wang	15
liu	33

经过DictVectorizer之后数据变成：

zhang	wang	liu	old
1	0	0	23
0	1	0	15
0	0	1	33

这其实是一种把数据特征中的非数值型特征转换成数值型特征的一种方法。

优惠劵

2h4n9y1m1n9

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
sklearn-特征提升之特征提取-----DictVectorizer

DictVectorizer的处理对象时符号化（非数字化）的但是具有一定结构的特征数据，如字典等，将符号转成数字0/1表示。test_dict = [{'name':'zhang','old':23},{'name':'wang','old':15},{'name':'liu','old':33}]from sklearn.feature_extraction import DictVe...
复制链接

扫一扫