【机器学习】特征工程 - 字典特征提取_机器学习字典

2401_84254087

于 2024-04-28 22:10:55 发布

阅读量663

点赞数 9

分类专栏：程序员文章标签：机器学习人工智能

本文链接：https://blog.csdn.net/2401_84254087/article/details/138293033

版权

本文介绍了如何使用scikit-learn的DictVectorizerAPI从字典形式的原始数据中提取数字特征，用于机器学习模型。它演示了数据转换过程，以及如何获取和理解特征名字。同时，文章也提到了学习黑客和网络安全的入门路径。

摘要由CSDN通过智能技术生成

特征工程就是从「原始数据」中提取「特征」，以供「算法」和「模型」使用。

简单来说就是将任意数据（比如文本和图像）转换为可用于机器学习的数字特征。

sklearn.feature_extraction 是用来提取特征的 API 。

sklearn.feature_extraction.DictVectorizer(sparse=True)

我们准备一个字典类型的数据，然后「提取」数字特征。

from sklearn import feature_extraction

# 原始数据（字典）
old_data = [
    {'name': "张三"

关注

专栏目录