sklearn-01-特征工程：特征提取

最新推荐文章于 2023-11-27 13:03:21 发布

置顶

来杯柠檬茶

最新推荐文章于 2023-11-27 13:03:21 发布

阅读量363

点赞数

分类专栏： sklearn 文章标签：机器学习特征工程

本文链接：https://blog.csdn.net/tom199611/article/details/99298724

版权

1 字典类型的特征抽取（结果是one-hot编码）

API：

from sklearn.feature_extraction import DictVectorizer

语法：

dv  = DictVectorizer(sparse=False)   #实例化
dv.fit_transform()		# 字典 --> one hot编码 
dv.inverse_transform()	#  one hot编码 --> 字典
dv..get_feature_names()  # 获取特征的名称

例子

# 字典特征抽取
from sklearn.feature_extraction import DictVectorizer
def dict_extraciton():
    data_dict = [{
   'city': '北京','temperature':32},
    {
   'city': '上海','temperature':22},
    {
   'city': '深圳','temperature':17}]
    dict_vectorizer  = DictVectorizer(sparse=False)
    one_hot_data  = dict_vectorizer.fit_transform(data_dict)
    print(dict_vectorizer.get_feature_names())
    print(one_hot_data)
    # 转回字典类型
    mydict = dict_vectorizer.inverse_transform(one_hot_data)
    print(mydict)
dict_extraciton()

['city=上海', 'city=北京', 'city=深圳', 'temperature']
[[ 0.  1.  0. 32.]
 [ 1.  0.  0. 22.]
 [ 0.  0.  1

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

来杯柠檬茶

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
sklearn-01-特征工程：特征提取

1 字典类型的特征抽取（结果是one-hot编码）API：from sklearn.feature_extraction import DictVectorizer语法：dv = DictVectorizer(sparse=False) #实例化dv.fit_transform() # 字典 --> one hot编码 dv.inverse_transform() # ...
复制链接

扫一扫