Spark MLlib (机器学习库)

本文介绍了机器学习的基础概念,包括有监督和无监督学习,以及人工智能相关领域。重点讲述了Spark的MLlib库,强调其在大规模机器学习中的优势,如内存计算和高效通信系统,并指出MLlib提供了多种机器学习算法,方便工程实践。
摘要由CSDN通过智能技术生成

机器学习

机器学习是啥?
机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

传统机器学习

  • 有监督学习(例如有y=kx+b,有y值)
  • 无监督学习(无y值,聚类分类)

人工智能

  • 深度学习
  • 强化学习
  • 迁移学习

机器学习的使用流程
在这里插入图片描述
在数据预处理阶段又大数据工程师进行数据处理,将数据分析师所需要的特征值从海量数据的数据源中提取出来,交给数据分析师,有时,数据预处理也又数据分析师来做。
通过所需要的特征来进行评价,不断训练模型,使得误差在接收范围内

在这里插入图片描述
如上图,通过色泽,根提,敲声的特征可以判断一个瓜是否是好瓜,我们通过对训练集进行模型训练,然后将测试集代入,如果误差值在接受范围内,则模型训练完成,否者直到

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值