机器学习-第三方库(工具包):scikit-learn【用于特征工程(主要分为三部分:数据预处理、特征选择、降维)】【Sklearn模块中包含常用的算法】

本文深入介绍了scikit-learn库在机器学习中的角色,特别是其在特征工程中的应用。从获取数据集、特征抽取、预处理到数据降维,详尽展示了scikit-learn提供的各类API,如加载鸢尾花、波士顿房价等经典数据集,以及如何进行数据预处理、特征抽取和降维操作。此外,还对比了归一化和标准化方法,探讨了PCA主成分分析在降维中的作用。
摘要由CSDN通过智能技术生成

sklearn是Python语言的机器学习工具

sklearn是做特征工程(做模型调算法)最常用也是最好用的工具没有之一。

Scikit-learn包括许多知名的机器学习算法的实现(算法原理一定要懂)

Scikit-learn文档完善,容易上手,封装的好,丰富的API,建立模型简单,预测简单,使其在学术界颇受欢迎。

Scikit-learn缺点:算法过程无法看到,有些参数都在算法Api内部优化,无法手动调参。(相对比的,tensorflow的Api有的封装的高,有的封装的低,可以手动调参。比如Scikit-learn的线性回归梯度下降法无法手动调α学习率大小,而tensorflow可以手动调节)

一、scikit-learn数据集

1、scikit-learn获取数据集

sklearn.datasets是scikit-learn获取数据集的api,加载获取流行数据集
load和fetch返回的数据类型datasets.base.Bunch(字典格式)

  • data:特征数据数组,是 [n_samples * n_features] 的二维numpy.ndarray 数组
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值