机器学习库 scikit-learn

scikit-learn基本功能主要分为六大部分:分类、回归、聚类、数据降维、模型选择和数据预处理。

1、分类

        分类属于有监督学习,是给对象指定所属类别范畴的。常见的应用场景有垃圾邮件检测、图像识别。分类已实现的算法有:K最邻近算法、逻辑回归、支持向量机、随机森林和决策树等。

2、回归

        回归是预测与给定对象相关的连续属性的值,常见的应用场景有预测股票价格、预测二手房交易价格。回归已实现的算法有:岭回归、贝叶斯回归和支持向量回归。

3、聚类

        聚类是自动识别具有相似属性的给定对象,并将其分组,属于无监督学习。常见的应用场景有顾客细分、实验结果分组。聚类已实现的算法有:K均值聚类

4、数据降维

        数据降维是通过降维技术来减少随机变量的个数。常见的应用场景有:可视化处理、效率提升。已实现的算法有:主成分分析、非负矩阵分解。

5、模型选择

        模型选择指对给定参数和模型进行比较、验证和选择,其目的是通过参数调整来提升精度。已实现的模块包括格点搜索、交叉验证和各种针对预测误差评估的度量函数。

6、数据预处理 

        数据预处理包括数据的特征提取、归一化、标准化。其中特征提取是将文本和图像数据转化为能用于机器学习的数字变量。归一化是将输入数据转换为具有零均值和单位方差的新变量,因为大多数情况下都做不到精度等于0,因此会设置一个可接受的范围,一般都要求在0~1。标准化是将数据转换到特定区间,如[0,1]。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值