sklearn-特征提升之特征提取-----DictVectorizer

DictVectorizer的处理对象时符号化(非数字化)的但是具有一定结构的特征数据,如字典等,将符号转成数字0/1表示。

test_dict = [{'name':'zhang','old':23},{'name':'wang','old':15},{'name':'liu','old':33}]

from sklearn.feature_extraction import DictVectorizer

#输出转化后的特征矩阵
print(vec.fit_transform(measurements).toarray())
#输出各个维度的特征含义
print(vec.get_feature_names())
[[ 0.  0.  1. 23.]
 [ 0.  1.  0. 15.]
 [ 1.  0.  0. 33.]]

['name=liu', 'name=wang', 'name=zhang', 'old']

原本的test_dict数据为:

nameold 
zhang23
wang15
liu33

经过DictVectorizer之后数据变成:

zhangwangliuold
10023
01015
00133

这其实是一种把数据特征中的非数值型特征转换成数值型特征的一种方法。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值