大数据
吾会飞飞飞
前进,前进,不择手段的前进!
展开
-
初始Hadoop 1
大数据下的困惑 随着数据规模的不断增长,单一的系统存储存在着存储容量、读写速率、计算效率等瓶颈。 Google针对这个问题 提出了 MapReduce BigTable GFS 三大理论,具有三大优势。 优势一:成本降低、能用PC机、就不使用大型机与高端存储。 优势二:软件保持容错性,硬件的故障视为一种常态,通过软件保持其可靠性。原创 2016-06-10 22:18:12 · 448 阅读 · 0 评论 -
Hadoop面试试题
基础知识 hadoop中需要配置那些配置文件,其作用是什么? HDFS的存储机制是什么? 怎么查看、删除、移动、拷贝HDFS上的文件? hadoop中combiner的作用? mapreduce的工作原理,mapreduce是如何运行的? hive数据库与oracle数据库有什么区别?目前hive数据库不支持那些函数? hbase常用命令,创建表,添加记录原创 2016-08-29 08:59:10 · 895 阅读 · 0 评论 -
初始Hadoop 2
Hadoop支持三种模式的配置 Standalone Operation 独立模式 默认模式,Hadoop被配置非分布式模式下运行,作为一个单一的Java程序来进行运行,便于调试。 Pseudo-Distributed Operation 伪分布式模式 以单一节点的形式伪分布,每一个Hadoop后台程序在一个单独的Java进程中运行。 Fully-Distributed Mo原创 2016-10-02 14:02:17 · 320 阅读 · 0 评论