scala
文章平均质量分 80
hopeatme
一切从头做起
展开
-
Scala 开发简单mapreduce 程序
看到这篇文章,肯定会有人问,“为什么要用scala来写MR, java写不是更自然?” 关于这个我问题,我个人的原因是: scala 写代码很简洁,而且我很享受这种体验。对于其它scala程序员来说,可能是因为所有项目都是用scala写,而且写scala更熟练些。对于这部分人非得用MR来解决的问题,那他一定有很充分的理由。 归正题吧, 下面讲讲用如何上手操作吧!! 鉴于大家使用的I原创 2016-09-25 01:26:03 · 5767 阅读 · 0 评论 -
Spark ML 2.1 --Pipelines
首先要引入概念 机器学习管道(ML pipelines),ML pipelines 提供基于DataFrames的高级API , 此API可以帮忙开发者创建和实践ML 管道。 Table of Contents Main concepts in Pipelines DataFramePipeline components TransformersEstimato翻译 2017-04-29 13:05:43 · 1348 阅读 · 0 评论 -
Spark ML 2.1 -- Extracting, transforming and selecting features (持续更新)
本章节覆盖特征相关的算法部分,可粗分为以下几组: 1> 抽取: 从原始数据中抽取特征 2> 变换:缩放,转化,或修改特征 3> 选择: 从特征集合中选择子集 4> Locality Sensitive Hashing (LSH) : 将特征变换和其它算法组合在一起的一类算法。 目录: Feature Extractors TF-IDFWord2VecCo翻译 2017-05-02 22:44:23 · 868 阅读 · 0 评论