机器学习自学笔记(2) -- 字典特征抽取

特征抽取

将任意数据转化成可用于机器学习的特征数据。

字典特征提取

使用APIsklearn.feature_extraction对字典提取时,使用DictVectorizer方法。
可以把字典转化成二维数组(矩阵)。
示例:


from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.feature_extraction import DictVectorizer

def dict_demo():
    """
    字典特征抽取
    :return:
    """
    data = [{"city":"北京","tem":100},{"city":"上海","tem":53},{"city":"武汉","tem":65}]
    #实例化一个转化类
    transfer = DictVectorizer(sparse=False)
    #调用feat_transform()
    data_new = transfer.fit_transform(data)
    print(transfer.get_feature_names())
    print(data_new)
    return None

if __name__ == '__main__':
    #字典特征抽取
    dict_demo()

结果:

当然,DictVectorizer(sparse=False)中也可以不写sparse=False,效果

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值