python中的sklearn_深入浅析Python 中的sklearn模型选择

最新推荐文章于 2024-05-21 16:07:28 发布

weixin_39710991

最新推荐文章于 2024-05-21 16:07:28 发布

阅读量205

点赞数

文章标签： python中的sklearn

1.主要功能如下：

1.classification分类

2.Regression回归

3.Clustering聚类

4.Dimensionality reduction降维

5.Model selection模型选择

6.Preprocessing预处理

2.主要模块分类：

1.sklearn.base: Base classes and utility function基础实用函数

2.sklearn.cluster: Clustering聚类

3.sklearn.cluster.bicluster: Biclustering 双向聚类

4.sklearn.covariance: Covariance Estimators 协方差估计

5.sklearn.model_selection: Model Selection 模型选择

6.sklearn.datasets: Datasets 数据集

7.sklearn.decomposition: Matrix Decomposition 矩阵分解

8.sklearn.dummy: Dummy estimators 虚拟估计

9.sklearn.ensemble: Ensemble Methods 集成方法

10.sklearn.exceptions: Exceptions and warnings 异常和警告

11.sklearn.feature_extraction: Feature Extraction 特征抽取

12.sklearn.feature_selection: Feature Selection 特征选择

13。sklearn.gaussian_process: Gaussian Processes 高斯过程

14.sklearn.isotonic: Isotonic regression 保序回归

15.sklearn.kernel_approximation: Kernel Approximation 核逼近

16.sklearn.kernel_ridge: Kernel Ridge Regression 岭回归ridge

17.sklearn.discriminant_analysis: Discriminant Analysis 判别分析

18.sklearn.linear_model: Generalized Linear Models 广义线性模型

19.sklearn.manifold: Manifold Learning 流形学习

20.sklearn.metrics: Metrics 度量权值

21.sklearn.mixture: Gaussian Mixture Models 高斯混合模型

22.sklearn.multiclass: Multiclass and multilabel classification 多等级标签分类

23.sklearn.multioutput: Multioutput regression and classification 多元回归和分类

24.sklearn.naive_bayes: Naive Bayes 朴素贝叶斯

25.sklearn.neighbors: Nearest Neighbors 最近邻

26.sklearn.neural_network: Neural network models 神经网络

27.sklearn.calibration: Probability Calibration 概率校准

28.sklearn.cross_decomposition: Cross decomposition 交叉求解

29.sklearn.pipeline: Pipeline 管道

30.sklearn.preprocessing: Preprocessing and Normalization 预处理和标准化

31.sklearn.random_projection: Random projection 随机映射

32.sklearn.semi_supervised: Semi-Supervised Learning 半监督学习

33.sklearn.svm: Support Vector Machines 支持向量机

34.sklearn.tree: Decision Tree 决策树

35.sklearn.utils: Utilities 实用工具

3.数据预处理：

from sklearn import preprocessing

标准化处理函数

将数据转化为标准正态分布（均值为0，方差为1）

preprocessing.scale(X,axis=0, with_mean=True, with_std=True, copy=True)

将数据在缩放在固定区间，默认缩放到区间 [0, 1]

preprocessing.minmax_scale(X,feature_range=(0, 1), axis=0, copy=True)

数据的缩放比例为绝对值最大值，并保留正负号，即在区间 [-1.0, 1.0] 内。唯一可用于稀疏数据 scipy.sparse的标准化

preprocessing.maxabs_scale(X,axis=0, copy=True)

通过 Interquartile Range (IQR) 标准化数据，即四分之一和四分之三分位点之间

weixin_39710991

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。