Spark学习
codereason
机器学习从业者,对大数据、搜索引擎、推荐系统、爬虫感兴趣,常用 Java/Python/Scala ,爱好:掌机、漫画、模拟器,欢迎加wx交流hibikekoinouta
展开
-
Hadoop学习笔记01-basics
Hadoop 是一个分布式计算的基础架构,用户在不需要了解底层细节的情况下,开发分布式的应用。Hadoop 最重要的是实现了一个分布式的文件系统,这样的文件系统可以架构在价格低廉的集群之上。Hadoop 另外一个重要内容就是MapReduce,一种分布式任务处理的架构。这两个部分构成了Hadoop的基石,Hadoop在创新在于从以前的以应用为中心,转变为以数据为中心。以前是应用获取数据进行处理...转载 2018-09-12 11:27:29 · 120 阅读 · 0 评论 -
大数据与机器学习博客推荐
自己很多时候学习大数据组件google问题,看到了讲解精彩的博客往往是浏览器加个书签就完事了,实际上很少会回过头来看,这样不好。我自己有时候还会把那个文章或解答的网页打印成PDF保存,但是像csdn这种毒瘤网站最近打印成PDF的样式非常糟糕,遂下定决心不再看csdn上的文章了。为此决定把个人常看的一些优秀数据科学社区和博客的地址放在这里(争取多看 除了SOF和官方文档之外,其实还有一些专注于数据科...原创 2018-11-11 22:17:41 · 146 阅读 · 0 评论