Sklearn特征提取

最新推荐文章于 2024-07-19 19:24:32 发布

数据科学家修炼之道

最新推荐文章于 2024-07-19 19:24:32 发布

阅读量441

点赞数

分类专栏： AI # Sklearn笔记文章标签：机器学习 sklearn 特征提取

本文为博主原创文章，欢迎转载，转载请注明出处。

本文链接：https://blog.csdn.net/xiligey1/article/details/112606847

版权

sklearn 特征提取 DictVectorizer 机器学习特征选择

关键词由CSDN通过智能技术生成

AI 同时被 2 个专栏收录

130 篇文章 7 订阅

订阅专栏

Sklearn笔记

55 篇文章 0 订阅

订阅专栏

模块 sklearn.feature_extraction 可用于提取符合机器学习算法支持的特征，比如文本和图片。

注意特征特征提取与特征选择有很大的不同：前者包括将任意数据（如文本或图像）转换为可用于机器学习的数值特征。后者是将这些特征应用到机器学习中。

>>> measurements = [
...     {'city': 'Dubai', 'temperature': 33.},
...     {'city': 'London', 'temperature': 12.},
...     {'city': 'San Francisco', 'temperature': 18.},
... ]

>>> from sklearn.feature_extraction import DictVectorizer
>>> vec = DictVectorizer()

>>> vec.fit_transform(measurements).toarray()
array([[  1.,   0.,   0.,  33.],
 [  0.,   1.,   0.,  12.],
 [  0.,   0.,   1.,  18.]])

>>> vec.get_feature_names()
['city=Dubai', 'city=London', 'city=San Francisco', 'temperature']