- 博客(3)
- 资源 (1)
- 收藏
- 关注
原创 Hadoop学习笔记(7)-简述MapReduce计算框架原理
1. MapReduce基本编程模型和框架1.1 MapReduce抽象模型大数据计算的核心思想是:分而治之。如下图1所示。把大量的数据划分开来,分配给各个子任务来完成。再将结果合并到一起输出。 注:如果数据的耦合性很高,不能分离,那么这种并行计算就不适合了。 图1:MapReduce抽象模型1.2 Hadoop的MapReduce的并行编程模型如下图2所示,Hadoop的MapReduce先将
2016-05-30 21:08:35 13183 3
原创 Hadoop学习笔记(6)-简述分布式文件系统HDFS原理
1.HDFS的基本框架与工作过程1.1 基本组成结构与文件访问过程HDFS是一个建立在一组分布式服务器节点的本地文件系统之上的分布式文件系统。其采用经典的主-从式结构,其基本组成结构如图1所示。 图1 HDFS的基本组成结构 一个HDFS文件系统包括一个主控节点NameNode和一组DataNode从节点。NameNode是一个主服务器,用来管理整个文件系统的命名空间和元数
2016-05-29 16:49:24 3700
原创 机器学习笔记(0)-有趣的机器学习:最简明入门指南
这篇文章作为机器学习的开篇。分享下自己的学习资料,并将所学的东西内容做分享。首先可以观看这篇有趣的入门文章---有趣的机器学习:最简明入门指南 http://blog.jobbole.com/67616/下面是我学习的视频,是斯坦福大学Andrew Ng教授在coursera视频。总共11周,足一分享学习笔记。也是作为自己的知识管理的一部分。https://www.coursera.org/lea
2016-05-25 19:49:31 953
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人