自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

jjfnjit的专栏

个人学习

  • 博客(3)
  • 问答 (1)
  • 收藏
  • 关注

原创 Spark机器学习3

3. Spark上数据的获取、处理与准备3.1 获取公开数据集MovieLens数据集:包含表示多个用户对多部电影的10万次评级数据,也包含电影元数据和用户属性信息。下载数据集,解压unzip ml-100k.zip会创建一个名为ml-100k的文件夹,进入文件夹 cd ml-100k其中重要的文件有u.user(用户属性文件)、u.item(电影元数据)和u.data(用户对电影的评级)

2015-11-18 17:31:56 1856

原创 Spark机器学习2

2. 设计机器学习系统

2015-11-18 17:30:21 601

原创 Spark机器学习5

5. Spark构建分类模型分类是监督学习的一种形式,我们用带有类标记或者类输出的训练样本训练模型。5.1 分类模型的种类Spark中常见的三种分类模型:线性模型、决策树和朴素贝叶斯模型。 线性模型:简单而且相对容易扩展到非常大的数据集决策树:一个强大的非线性技术,训练过程计算量大而且较难扩展,但是在很多情况下性能很好。朴素贝叶斯模型:简单,易训练,并且具有高效和并行的优点

2015-11-02 12:17:23 2039

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除