scikit-learn API

one-vs-the-rest元分类器还实现了predict_proba方法，只要这种方法由基类分类器实现即可。此方法返回单标签和多标签情况下的类成员资格的概率。请注意，在多标签情况下，概率是给定样本在给定类中下降的边际概率。因此，在多标签情况下，给定样本的所有可能标签上的这些概率的总和将不会总和为单位，如在单标签情况中那样。

用户指南：有关详细信息，请参阅多类和多标记算法部分。

multiclass.OneVsRestClassifier(estimator[, …])：One-vs-the-rest（OvR）多类/多标签策略

multiclass.OneVsOneClassifier(estimator[, …])：一对一多类策略

multiclass.OutputCodeClassifier(estimator[, …])：（纠错）输出代码多类策略

`sklearn.multioutput`: 多输出回归和分类

该模块实现了多输出回归和分类。

此模块中提供的估算器是元估计器：它们需要在其构造函数中提供基本估计器。元估计器将单输出估计器扩展到多输出估计器。

用户指南：有关详细信息，请参阅多类和多标记算法部分。

multioutput.ClassifierChain(base_estimator)：一种多标签模型，可将二元分类器排列成链。

multioutput.MultiOutputRegressor(estimator)：多目标回归

multioutput.MultiOutputClassifier(estimator)：多目标分类

`sklearn.naive_bayes`: 朴素贝叶斯

该sklearn.neighbors模块实现了k近邻算法。

用户指南：有关详细信息，请参阅最近邻居部分。

naive_bayes.BernoulliNB([alpha, binarize, …])：用于多变量伯努利模型的朴素贝叶斯分类器。

naive_bayes.GaussianNB([priors])：高斯朴素贝叶斯（GaussianNB）

naive_bayes.MultinomialNB([alpha, …])：用于多项式模型的朴素贝叶斯分类器

`sklearn.neighbors`: 近邻算法

该sklearn.neighbors模块实现了k近邻算法。

用户指南：有关详细信息，请参阅最近邻居部分。

neighbors.BallTree：BallTree用于快速广义N点问题

neighbors.DistanceMetric：DistanceMetric类

neighbors.KDTree：KDTree用于快速广义N点问题

neighbors.KernelDensity([bandwidth, …])：核密度估计

neighbors.KNeighborsClassifier([…])：实现k近邻的分类器投票。

neighbors.KNeighborsRegressor([n_neighbors, …])：基于k-最近邻居的回归。

neighbors.LocalOutlierFactor([n_neighbors, …])：使用局部异常因子（LOF）的无监督异常值检测

neighbors.RadiusNeighborsClassifier([…])：在给定半径内的邻居之间实施投票的分类器

neighbors.RadiusNeighborsRegressor([radius, …])：基于固定半径内的邻居的回归。

neighbors.NearestCentroid([metric, …])：最近的质心分类器。

neighbors.NearestNeighbors([n_neighbors, …])：用于实现邻居搜索的无监督学习者。

neighbors.kneighbors_graph(X, n_neighbors[, …])：计算X中点的k-邻居的（加权）

neighbors.radius_neighbors_graph(X, radius)：计算X中各点的邻居（加权）

`sklearn.neural_network`: 神经网络模型

该sklearn.neural_network模块包括基于神经网络的模型。

用户指南：有关详细信息，请参阅神经网络模型（监督）和神经网络模型（无监督）部分。

neural_network.BernoulliRBM([n_components, …])：伯努利限制玻尔兹曼机器（RBM）。

neural_network.MLPClassifier([…])：多层感知器分类器。

neural_network.MLPRegressor([…])：多层感知器回归器。

`sklearn.pipeline`: 管道

该sklearn.pipeline模块实现了用于构建复合估计器的实用程序，作为变换和估计器链。

pipeline.FeatureUnion(transformer_list[, …])：连接多个变换器对象的结果。

pipeline.Pipeline(steps[, memory])：使用最终估算器进行变换的流水线。

pipeline.make_pipeline(*steps, **kwargs)：从给定的估算器构造管道。

pipeline.make_union(*transformers, **kwargs)：从给定的变换器构造一个FeatureUnion。

`sklearn.preprocessing`: 预处理和规范化

该sklearn.preprocessing模块包括缩放，居中，标准化，二值化和插补方法。

用户指南：有关详细信息，请参阅预处理数据部分。

preprocessing.Binarizer([threshold, copy])：根据阈值将数据二值化（将特征值设置为0或1）

preprocessing.FunctionTransformer([func, …])：从任意可调用构造变换器。

preprocessing.Imputer([missing_values, …])：用于完成缺失值的插补变换器。

preprocessing.KernelCenterer：将核心矩阵居中

preprocessing.LabelBinarizer([neg_label, …])：以一对一的方式对标签进行二值化

preprocessing.LabelEncoder：编码值介于0和n_classes-1之间的标签。

preprocessing.MultiLabelBinarizer([classes, …])：在可迭代的迭代和多标签格式之间进行转换

preprocessing.MaxAbsScaler([copy])：按每个特征的最大绝对值缩放。

preprocessing.MinMaxScaler([feature_range, copy])：通过将每个要素缩放到给定范围来转换要素。

preprocessing.Normalizer([norm, copy])：将样本单独归一化为单位范数。

preprocessing.OneHotEncoder([n_values, …])：使用one-hot又称K-K方案对分类整数特征进行编码。

preprocessing.PolynomialFeatures([degree, …])：生成多项式和交互功能。

preprocessing.QuantileTransformer([…])：使用分位数信息转换要素。

preprocessing.RobustScaler([with_centering, …])：使用对异常值具有鲁棒性的统计信息来扩展要素。

preprocessing.StandardScaler([copy, …])：通过删除均值和缩放到单位方差来标准化特征

preprocessing.add_dummy_feature(X[, value])：增加具有附加虚拟特征的数据集。

preprocessing.binarize(X[, threshold, copy])：类数组或scipy.sparse矩阵的布尔阈值

preprocessing.label_binarize(y, classes[, …])：以一对一的方式对标签进行二值化

preprocessing.maxabs_scale(X[, axis, copy])：将每个要素缩放到[-1,1]范围，而不会破坏稀疏性。

preprocessing.minmax_scale(X[, …])：通过将每个要素缩放到给定范围来转换要素。

preprocessing.normalize(X[, norm, axis, …])：将输入向量单独缩放到单位范数（向量长度）。

preprocessing.quantile_transform(X[, axis, …])：使用分位数信息转换要素。

preprocessing.robust_scale(X[, axis, …])：沿任意轴标准化数据集

preprocessing.scale(X[, axis, with_mean, …])：沿任意轴标准化数据集

`sklearn.random_projection`: 随机投影

随机投影变压器

随机投影是一种简单且计算有效的方法，通过交换受控制的精度（作为附加方差）来缩短数据的维数，从而缩短处理时间并缩小模型尺寸。

控制随机投影矩阵的尺寸和分布，以便保持数据集的任何两个样本之间的成对距离。

随机投影效率背后的主要理论结果是 Johnson-Lindenstrauss引理（引用维基百科）：

在数学中，Johnson-Lindenstrauss引理是关于从高维到低维欧几里德空间的低失真嵌入点的结果。该引理指出，高维空间中的一小组点可以嵌入到更低维度的空间中，使得点之间的距离几乎保持不变。用于嵌入的地图至少是Lipschitz，甚至可以被视为正交投影。

用户指南：有关详细信息，请参阅随机投影部分。

random_projection.GaussianRandomProjection([…])：通过高斯随机投影降低维数

random_projection.SparseRandomProjection([…])：通过稀疏随机投影减少维数

random_projection.johnson_lindenstrauss_min_dim(…)：找到随机投射到的“安全”数量的组件

`sklearn.semi_supervised` 半监督学习

该sklearn.semi_supervised模块实现了半监督学习算法。这些算法利用少量标记数据和大量未标记数据进行分类任务。该模块包括Label Propagation。

用户指南：有关详细信息，请参阅半监督部分。

semi_supervised.LabelPropagation([kernel, …])：标签传播分类器

semi_supervised.LabelSpreading([kernel, …])：LabelSpreading模型用于半监督学习

`sklearn.svm`: 支持向量机

该sklearn.svm模块包括支持向量机算法。

用户指南：有关详细信息，请参阅“ 支持向量机”部分。

估算器

svm.LinearSVC([penalty, loss, dual, tol, C, …])：线性支持向量分类。

svm.LinearSVR([epsilon, tol, C, loss, …])：线性支持向量回归。

svm.NuSVC([nu, kernel, degree, gamma, …])：Nu支持向量分类。

svm.NuSVR([nu, C, kernel, degree, gamma, …])：Nu支持向量回归。

svm.OneClassSVM([kernel, degree, gamma, …])：无监督异常值检测。

svm.SVC([C, kernel, degree, gamma, coef0, …])：C-支持向量分类。

svm.SVR([kernel, degree, gamma, coef0, tol, …])：Epsilon支持向量回归。

svm.l1_min_c(X, y[, loss, fit_intercept, …])：返回C的最低边界，使得对于C in（l1_min_C，infinity），模型保证不为空。

低级方法

svm.libsvm.cross_validation：交叉验证程序的绑定（低级程序）

svm.libsvm.decision_function：预测保证金（libsvm名称为predict_values）

svm.libsvm.fit：使用libsvm训练模型（低级方法）

svm.libsvm.predict：给定模型预测X的目标值（低级方法）

svm.libsvm.predict_proba：预测概率

`sklearn.tree`: 决策树

该sklearn.tree模块包括用于分类和回归的基于决策树的模型。

用户指南：有关详细信息，请参阅决策树部分。

tree.DecisionTreeClassifier([criterion, …])：决策树分类器。

tree.DecisionTreeRegressor([criterion, …])：决策树回归量。

tree.ExtraTreeClassifier([criterion, …])：一个极随机的树分类器。

tree.ExtraTreeRegressor([criterion, …])：一个非常随机的树回归器。

tree.export_graphviz(decision_tree[, …])：以DOT格式导出决策树。

`sklearn.utils`: 实用程序

该sklearn.utils模块包括各种实用程序。

开发人员指南：有关详细信息，请参阅“ 实用程序开发人员”页面。

utils.as_float_array(X[, copy, force_all_finite])：将类数组转换为浮点数组。

utils.assert_all_finite(X)：如果X包含NaN或无穷大，则抛出ValueError。

utils.check_X_y(X, y[, accept_sparse, …])：标准估算器的输入验证。

utils.check_array(array[, accept_sparse, …])：对数组，列表，稀疏矩阵或类似的输入验证。

utils.check_consistent_length(*arrays)：检查所有阵列是否具有一致的第一维。

utils.check_random_state(seed)：将种子转换为np.random.RandomState实例

utils.class_weight.compute_class_weight(…)：估算不平衡数据集的类权重。

utils.class_weight.compute_sample_weight(…)：对于不平衡数据集，按类别估算样本权重。

utils.estimator_checks.check_estimator(Estimator)：检查估算员是否遵守scikit-learn惯例。

utils.extmath.safe_sparse_dot(a, b[, …])：正确处理稀疏矩阵情况的点积

utils.indexable(*iterables)：使数组可转换为交叉验证。

utils.resample(*arrays, **options)：以一致的方式重新采样数组或稀疏矩阵

utils.safe_indexing(X, indices)：使用索引从X返回项目或行。

utils.shuffle(*arrays, **options)：以一致的方式随机播放阵列或稀疏矩阵

utils.sparsefuncs.incr_mean_variance_axis(X, …)：在CSR或CSC矩阵上计算沿轴的增量均值和方差。

utils.sparsefuncs.inplace_column_scale(X, scale)：CSC / CSR矩阵的原位列缩放。

utils.sparsefuncs.inplace_row_scale(X, scale)：CSR或CSC矩阵的原位行缩放。

utils.sparsefuncs.inplace_swap_row(X, m, n)：就地交换两行CSC / CSR矩阵。

utils.sparsefuncs.inplace_swap_column(X, m, n)：就地交换两列CSC / CSR矩阵。

utils.sparsefuncs.mean_variance_axis(X, axis)：沿CSR或CSC矩阵上的轴上计算均值和方差

utils.validation.check_is_fitted(estimator, …)：对估算器执行is_fitted验证。

utils.validation.check_memory(memory)：检查memory是否像joblib.Memory一样。

utils.validation.check_symmetric(array[, …])：确保数组是2D，方形和对称。

utils.validation.column_or_1d(y[, warn])：Ravel列或1d numpy数组，否则会引发错误

utils.validation.has_fit_parameter(…)：检查估计器的拟合方法是否支持给定参数。

http://scikit-learn.org/stable/documentation.html

转载于:https://www.cnblogs.com/chenxygx/p/9578256.html

weixin_30527423

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
scikit-learn API

scikit-learn API这是scikit-learn的类和函数参考。有关详细信息，请参阅完整的用户指南，因为类和功能原始规格可能不足以提供有关其用途的完整指南。sklearn.base：基类和实用函数所有估算器的基类。基类base.BaseEstimator：scikit-learn中所有估算器的基类base.BiclusterMixin：Mixin类适用于scik...
复制链接

扫一扫