sklearn特征抽取----01字典类型特征提取（DictVectorizer）

最新推荐文章于 2022-11-04 20:24:16 发布

寅月十八

最新推荐文章于 2022-11-04 20:24:16 发布

阅读量669

点赞数 1

分类专栏： # scikit-learn 文章标签：机器学习

MYJ-江启

本文链接：https://blog.csdn.net/weixin_46165569/article/details/106885075

版权

scikit-learn 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

文章目录

作用

把python中字典数据(dict)进行特征值化

类和方法

类

DictVectorizer(sparse=True)
默认为True，返回一个sparse矩阵
False，不转换为sparse矩阵

类 DictVectorizer实现了one-hot编码，将数据的特征分离，数据被分为分类属性和传统属性

eg：
data = [
{‘city’: ‘北京’,‘temperature’:100},
{‘city’: ‘上海’,‘temperature’:60},
{‘city’: ‘深圳’,‘temperature’:30},
]

城市是分类属性，温度是传统属性，经过特征抽取分类属性用0或者1表示，传统属性不变

方法

方法	作用
fit_transform(Param)	Param:字典或者包含字典的迭代器返回值：返回sparse矩阵
inverse_transform(Param)	Parm:array数组或者sparse矩阵返回值：转换之前的数据格式
get_feature_names()	返回值：返回分类类别的名称
transform(data)	按照之前的标准转换

流程

from sklearn.feature_extraction import DictVectorizer

data = [
    {'city': '北京','temperature':100},
    {'city': '上海','temperature':60},
    {'city': '深圳','temperature':30},
]

def dictdata():
    """
    字典数据抽取
    :return: None
    """
	 # 实例化
    dic = DictVectorizer(sparse=False)
    # 数据转换
    dat = dic.fit_transform(data)
    # 数据分类名称
    print(dic.get_feature_names())

	print(dat)
	
	# 数据回转，把数据转换为最先的未处理格式
    print(dic.inverse_transform(dat))

在这里插入图片描述

寅月十八

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
sklearn特征抽取----01字典类型特征提取（DictVectorizer）

文章目录作用类和方法类方法流程作用把python中字典数据(dict)进行特征值化类和方法类DictVectorizer(sparse=True)默认为True，返回一个sparse矩阵False，不转换为sparse矩阵类 DictVectorizer实现了one-hot编码，将数据的特征分离，数据被分为分类属性和传统属性eg：data = [{‘city’: ‘北京’,‘temperature’:100},{‘city’: ‘上海’,‘temperature’:60},
复制链接

扫一扫