自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 资源 (1)
  • 收藏
  • 关注

转载 大数据12_SparkMLlib监督学习和无监督学习区别

机器学习的常用方法,主要分为有监督学习(supervised learning)和无监督学习(unsupervised learning)。监督学习,就是人们常说的分类,通过已有的训练样本(即已知数据以及其对应的输出)去训练得到一个最优模型(这个模型属于某个函数的集合,最优则表示在某个评价准则下是最佳的),再利用这个模型将所有的输入映射为相应的输出,对输出进行简单的判断从而实现分类的目的,也就具有

2018-04-30 17:02:13 787

原创 大数据12_Spark MLlib介绍

一、什么是机器学习?已有的数据(经验),训练某种模型,利用此模型预测未来。1998年Tom Mitchell对机器学习给出了一个更加正式的定义:A computer program is said to learn from experience E with respect to some task T and some performance measure P,if its performa...

2018-04-12 12:15:43 971

oozie调度脚本.docx

使用Oozie进行资源的可视化调度,统一调度hadoop系统中常见的mr任务启动、hdfs操作、shell调度、hive操作等使得复杂的依赖关系、时间触发、事件触发使用xml语言进行表达,开发效率提高一组任务使用一个DAG来表示,使用图形表达流程逻辑更加清晰支持很多种任务调度,能完成大部分hadoop任务处理 程序定义支持EL常量和函数,表达更加丰富

2020-02-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除