特征既有类型（nominal）变量又有数据/数字（ratio）变量的时候，该怎么进行特征处理呢？不妨试试sklearn的DictVectorizer

最新推荐文章于 2023-03-14 09:58:54 发布

千行百行

最新推荐文章于 2023-03-14 09:58:54 发布

阅读量784

点赞数

分类专栏： # sklearn 文章标签： sklearn 机器学习 python

欢迎转载，但是请明确地标注清楚源自CSDN千行百行。不加标注，虽远必诛！！！

本文链接：https://blog.csdn.net/shiyuzuxiaqianli/article/details/122504034

版权

sklearn 专栏收录该内容

6 篇文章

订阅专栏

直接上代码，然后就着代码分析

>>> from sklearn.feature_extraction import DictVectorizer
>>> v = DictVectorizer(sparse=False)
>>> D = [{'性别': '男', '年龄': 2}, {'性别': '女', '年龄': 23}]
>>> X = v.fit_transform(D)
>>> X
array([[ 2.,  0.,  1.],
       [23.,  1.,  0.]])
>>> v.inverse_transform(X) == [{'年龄': 2.0, '性别=男': 1.0},
...                            {'年龄': 23.0, '性别=女': 1.0}]

>>> v.transform({'性别': '男', '年龄': 267})
array([[267.,   0.,   1.]])