- 博客(3)
- 资源 (12)
- 收藏
- 关注
原创 大数据-大数据学习过程
本文旨在为普通程序员(Java程序员最佳)提供一个入门级别的大数据技术学习路径,不适用于大数据工程师的进阶学习,也不适用于零编程基础的同学。 前言: 一、背景介绍 二、大数据介绍 正文: 一、大数据相关的工作介绍 二、大数据工程师的技能要求 三、大数据学习规划 四、持续学习资源推荐(书籍,博客,网站) 五、项目案例分析(批处理+实时处理) 前言 一、背景介绍 本人目前是一名大数...
2018-09-13 11:03:50 5032 1
原创 大数据知识二-大数据组件
离线计算组件 1.1 hive hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。但是在转换为MapReduce的计算过程中,计算速...
2018-09-13 10:48:56 590
原创 大数据基础一
整个大数据处理的体系,按我的理解可以分为两个部分,一个是分布式存储系统、另一个是分布式计算框架。分布式存储系统主流是HadoopDFS,其他还有Ceph和Swift。分布式计算框架主流是MapReduce,Storm和Spark。 首先说分布式存储系统HadoopDFS。它是一种本地文件系统之上的更高的抽象,把跨节点的组成的文件系统看成一个逻辑上的整体。它存储的思路是,把...
2018-09-13 10:32:25 193
匿名内部类核心重点知识讲解和经典例子讲解
2011-10-22
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人