学习笔记
文章平均质量分 79
sdoddyjm68
这个作者很懒,什么都没留下…
展开
-
HandsOn-ML学习笔记(1)用机器学习方法解决简单回归问题
很久没法博客了,可能自己也变懒了,正好最近在看一本大神推荐的书,准备写写笔记,把自己不会的,解决了的记录下来。文中的中文全部来自作者蹩脚的翻译,还望理解书名叫《Hands-On Machine Learning with Scikit-Learn & Tensorflow》,我用的是东南大学的影印版,封面大概是这个样子(图片来自京东) 第一章主要是讲了机器学习的基础知识,主要的几个分类(原创 2018-01-06 21:25:55 · 3746 阅读 · 0 评论 -
learning-spark 学习笔记(1):装个环境
最近在学习 Spark框架版本迭代很快,这本书上的Spark版本是1.1,对应的hadoop版本是2.4。遗憾的是Apache Spark已经不提供1.1版本的下载了,为了避免版本更迭导致的学习受阻,要尽量采用低版本的Spark和hadoopSpark下载地址:Apach Spark。 Spark提供java、scala及python的api接口 如果使用的是python且pytho...原创 2018-03-07 23:15:48 · 698 阅读 · 0 评论 -
learning-spark学习笔记(2):reduce()、fold()和aggregate()的区别
reduce()、fold()和aggregate()都是在spark中对RDD的聚合操作,在理解这几个函数的时候费了一点劲reduce()和fold()要求操作的RDD是同种类型,也就是操作的元素类型和返回的元素类型一致temp = sc.parallelize([1,2,3,4])sum = temp.reduce(lambda x, y: x + y)注意这里x指的是这...原创 2018-03-10 11:02:09 · 2798 阅读 · 0 评论