“Spark上流式机器学习算法实现”中期检查报告

最新推荐文章于 2021-06-24 16:27:36 发布

VIP文章 zhangyuming010

最新推荐文章于 2021-06-24 16:27:36 发布

阅读量2.7k

点赞数

分类专栏：开源夏令营文章标签： scala spark 机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhangyuming010/article/details/38364867

版权

从7月初到现在已经快一个月左右了，我们的项目总体进展比较顺利，本次中期检查报告主要分为两部分：前期工作总结和后期展望。

一、前期工作总结

项目前期我们的工作主要是围绕“基于spark的流式广义线性模型算法实现”这个目标去做的。万事开头难，要实现算法，必须首先得搭建开发环境。

1、搭建基于linux和windows的spark和scala的开发环境

由于在windows上有支持Scala语言的scala-IDE这个软件，编程非常清晰和方便，如下图所示。

另外，由于基于spark库的程序在linux上运行起来更方便，通过spark-submit这个应用就可以运行基于spark的程序，还可以方便地修改配置参数，因此我们在linux机器上也装好了scala语言和spark的开发环境（详见博文“基于linux的spark与scala开发环境搭建”）。

1、学习scala语言和运行spark程序

由于刚开始接触scala语言，对其并不是很熟悉，熟悉一种语言的最好的办法当然是看它的源代码并且运行程序。

我们通过对spark1.0.0版本的一些简单例程的学习，如单词统计（如下图）、计算π等例子，慢慢熟悉并掌握了Scala语言的基本的函数式编程技巧和代码

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
“Spark上流式机器学习算法实现”中期检查报告

从7月初到现在已经快一个月左右了，我们的项目总体进展比较顺利，本次中期检查报告主要分为两部分：前期工作总结和后期展望。一、前期工作总结项目前期我们的工作主要是围绕“基于spark的流式广义线性模型算法实现”这个目标去做的。万事开头难，要实现算法，必须首先得搭建开发环境。1、搭建基于linux和windows的spark和scala的开发环境由于在windows上有支持Scala语言
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。