Python机器学习库SKLearn包含的内容(目录)

#Sklearn学习
"""
一、机器学习主要分类:
      1、预处理
      2、模型选择
      3、分类
      4、回归
      5、聚类
      6、降维
      
机器学习主要包含内容:
    1、监督学习
        1.1 广义线性模型(Generalized Linear Models)
        1.2 线性二次判别分析(Linear and Quadratic Discriminant Analysis)
        1.3 核岭回归(Kernel ridge regression)
        1.4 支持向量机(Support Vector Machines)
        1.5 随机梯度下降(Stochastic Gradient Descent)
        1.6 最近邻(Nearest Neighbors)
        1.7 高斯过程(Gaussian Processes)
        1.8 交叉分解(Cross decomposition)
        1.9 朴素贝叶斯(Naive Bayes)
        1.10 决策树(Decision Trees)
        1.11 集成方法(Ensemble methods)
        1.12 多类和多标签算法(Multiclass and multilabel algorithms)
        1.13 特征选择(Feature selection)
        1.14 半监督(Semi-Supervised)
        1.15 保序回归(Isotonic regression)
        1.16 概率校准(Probability calibration)
        1.17 神经网络模型(监督)(Neural network models (supervised))
        
    2、无监督学习
        2.1 高斯混合模型(Gaussian mixture models)
        2.2 流形学习(Manifold learning)
        2.3 聚类(Clustering)
        2.4 双聚类(Biclustering)
        2.5 分解信号分量(矩阵分解问题)(Decomposing signals in components (matrix factorization problems))
        2.6 协方差估计(Covariance estimation)
        2.7 异常值检测(Novelty and Outlier Detection)
        2.8 密度估计(Density Estimation)
        2.9 神经网络模型(无监督)(Neural network models (unsupervised))
        
    3、模型选择和评估
        3.1 交叉验证:评估估计器性能(Cross-validation: evaluating estimator performance)
        3.2 调整估计器的超参数(Tuning the hyper-parameters of an estimator)
        3.3 模型评价:量化预测的质量(Model evaluation: quantifying the quality of predictions)
        3.4 模型持久性( Model persistence)
        3.5 验证曲线:绘制分数以评估模型( Validation curves: plotting scores to evaluate models)
        
    4、数据集转换
        4.1 管道和特征:组合估计量
        4.2 特征提取
        4.3 预处理数据
        4.4 无监督降维
        4.5 随机投影
        4.6 内核近似
        4.7 成对度量,亲和度和内核
        4.8 变换预测目标(y)
        
    5、数据集加载实用程序
        5.1 通用数据集API(General dataset API)
        5.2 玩具数据集(Toy datasets)
        5.3 示例图像(Sample images)
        5.4 样品发生器(Sample generators)
        5.5 svmlight / libsvm格式的数据集(Datasets in svmlight / libsvm format)
        5.6 从外部数据集加载(Loading from external datasets)
        5.7 Olivetti面数据集(The Olivetti faces dataset)
        5.8 20个新闻组文本数据集(The 20 newsgroups text dataset)
        5.9 从mldata.org存储库下载数据集(Downloading datasets from the mldata.org repository)
        5.10 野生面部识别数据集中的标记面(The Labeled Faces in the Wild face recognition dataset)
        5.11 森林covertypes( Forest covertypes)
        5.12 RCV1数据集(RCV1 dataset)
        5.13 波士顿房价数据集(Boston House Prices dataset)
        5.14 乳腺癌威斯康星(诊断)数据库(Breast Cancer Wisconsin (Diagnostic) Database)
        5.15 糖尿病数据集(Diabetes dataset)
        5.16 手写数字数据集的光学识别(Optical Recognition of Handwritten Digits Data Set)
        5.17 虹膜植物数据库(Iris Plants Database)
        5.18 Linnerrud数据集(Linnerrud dataset)

    6、计算规模的策略:更大的数据
        6.1 使用核外学习来扩展实例(Scaling with instances using out-of-core learning)
        
    7、计算性能
        7.1 预测延迟(Prediction Latency)
        7.2 预测吞吐量(Prediction Throughput)
        7.3 技巧和窍门(Tips and Tricks)
    
"""

  • 2
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: python机器学习sklearn是一个功能强大的机器学习工具包,提供了许多机器学习算法和工具,包括分类、回归、聚类、降维、模型选择、预处理等等。它的目的是使机器学习更加简单和可重复,以便更多的人可以轻松地使用它。 sklearn的代码风格简洁明了,易于理解和使用。它也提供了许多评估指标和工具,帮助用户评估模型的性能。此外,它还支持许多常见的数据集,方便用户进行试验和研究。 总的来说,sklearn是一个非常实用的机器学习工具包,适用于各种机器学习任务。如果你是一个初学者,或者是一个经验丰富的机器学习工程师,都可以从sklearn中受益。 ### 回答2: Python机器学习sklearn是一个功能强大的开源工具,可实现各种常见和先进的机器学习任务。它通过提供简洁易用的API,使得机器学习的各个方面更加容易上手。 sklearn包含了众多的工具,包括预处理、特征提取、监督和无监督学习算法等等。其中,监督学习算法包括分类、回归和聚类。预处理工具包括缺失数据处理、数据标准化等等。而特征提取方面,sklearn支持所有流行的提取技术,如HOG、LBP和Sift等。无论从哪个角度看,sklearn都是一款强大的工具。 sklearn的优点在于它广泛的支持性。它提供了许多内置的数据集,使得机器学习工作更加容易上手。此外,sklearn还提供了许多功能强大的可视化工具,辅助开发者理解机器学习结果。 sklearn做得不足之处在于其内置算法并没有涵盖所有机器学习任务。例如,它并未支持深度学习,限制了其使用范围。另外,由于sklearn提供的是封装的算法,一定程度上降低了自定义的空间。 总而言之,sklearn是一款非常实用的机器学习工具,它在广泛的支持性、API易用性、可视化工具和算法效果上均有表现。但是,虽然它不是完美的,但它仍然是大多数机器学习项目的首选之一。 ### 回答3: Python机器学习sklearn是一个强大的工具,它提供了多种机器学习算法和工具,包括分类、回归、聚类、降维、模型选择和预处理等功能。sklearn是对其他Python数据处理,如NumPy和Pandas的补充,使得用户可以快速轻松地对数据进行一些复杂的操作。在许多数据科学和机器学习项目中,sklearn成为了一个不可或缺的工具。 sklearn主要被开发用于数据挖掘和数据分析,并被广泛应用于分类、聚类、回归和推荐系统等领域。该提供了许多流行的机器学习算法实现,如支持向量机(SVM)、K近邻(KNN)、决策树、随机森林、朴素贝叶斯等。这些算法可以应用于不同类型的数据,如数值、分类、文本、图像和语音等数据。 sklearn的另一个重要特点是它提供了许多有用的数据预处理和数据转换方法,如标准化、归一化、降维、数据合并等方法,这些方法可以使数据更适合于机器学习算法的应用。sklearn还提供了模型选择和评估的工具,如交叉验证、网格搜索和性能度量等方法,这些方法可以帮助用户有效地选择合适的算法和调整其参数。 sklearn的优点不仅在于它的功能和性能,而且在于它在Python社区的支持和贡献。由于python机器学习的社区非常活跃,因此sklearn能够获得广泛的应用和支持。此外,sklearn详细的文档和示例使得学习和使用该变得更加轻松和容易。 总之,Python机器学习sklearn是一个功能强大、易于使用和广泛应用于数据科学和机器学习项目的工具,它的优点在于其提供了众多有用的机器学习算法和工具,清晰的文档和示例以及强大的Python社区的支持。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值