写在前面:
在本分类专栏下的1-9翻译文章,和两篇sparkUDF的文章都是属于spark的常规低阶的用法,基本能满足日常的分析功能了。
但是这些基本用法并没有涉及、也无法满足机器学习建模的需求。
比如拆分特征向量和目标向量,比如生成特征向量,比如使用分类或回归模型,比如使用深度学习模型等....
所以,从这篇文章开始,我们开始学习spark的高阶用法,即spark用于机器学习、深度学习。
注意要结合官方文档学习,里面有非常详细的API说明和代码示例,非常有助于理解和实践应用。也是日后工作时常备的查询手册。
Spark高阶用法之机器学习-读书笔记