- 博客(8)
- 资源 (4)
- 收藏
- 关注
转载 初学HBase的几个问题
本文主要针对对HBase不了解的人。主要想基于个人的理解回答以下几个问题: 什么是HBase?何时用HBase?与Hive、Pig的区别?HBase的结构为何HBase速度很快?HBase常用的操作有哪些?HBase的一些配置和监控 什么是HBase?HBase,是Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统。使用HBase技术可以在廉
2015-02-12 22:05:41 3712
转载 Spark History Server配置使用(zhuan)
Spark History Server配置使用Spark history Server产生背景以standalone运行模式为例,在运行Spark Application的时候,Spark会提供一个WEBUI列出应用程序的运行时信息;但该WEBUI随着Application的完成(成功/失败)而关闭,也就是说,Spark Application运行完(成功/失败)后,将无法查
2015-02-11 16:20:27 15600
原创 spark 案例集群测试整理
时间:20150210 工作过程:今天打算使用spark 自带的案例sparkpi 对集群进行测试,主要向了解集群启动过程及机器的负载情况。没想到问题还还真不少,感谢群友,特别是hali 支持。主要的问题有3个:1.测试spark 集群与local 运行方式使用的差别及集群测试时Ip 与机器访问的处理2.spark 集群不能重启问题的处理 1。.测试spark 集群与loca
2015-02-11 08:13:18 14508
转载 分布式数据库 Hbase 的高可用管理和监控(1)
分布式数据库 Hbase 的高可用管理和监控(1)www.educity.cn 发布者:mutou20008 来源:网络转载 发布日期:2014年10月02日文章评论 发表文章 Apache HBase 的基本知识 2006 年 11 月,Google 发表了一篇名为《 BigTable 》论文 , 2007 年 2 月,Hadoop 的开发人员对
2015-02-05 16:54:37 1036
转载 最详细的hadoop2.2.0集群的HA高可靠的最简单配置(转)
最详细的hadoop2.2.0集群的HA高可靠的最简单配置您的评价: 较差 收藏该经验 简介 hadoop中的NameNode好比是人的心脏,非常重要,绝对不可以停止工作。在hadoop1时代,只有一个NameNode。如果该NameNode数据丢失或者不能工作,那么整个集群就不能
2015-02-05 16:34:33 779
转载 Spark编程指南-转
Spark开发指南简介总的来说,每一个Spark应用程序,都是由一个驱动程序组成,它运行用户的main函数,并且在一个集群上执行各种各样的并行操作。Spark提供的主要的抽象(概念)是一个弹性分布式数据集,它是一个元素集合,划分到集群的不同节点上,可以被并行操作。RDDs的创建可以从Hadoop文件系统(或者任何支持Hadoop的文件系统)上的一个文件开始,或者通过转换这个驱动程序中已存在
2015-02-04 08:57:30 1524
转载 Windows下IntelliJ IDEA中调试Spark Standalone
参考:http://dataknocker.github.io/2014/11/12/idea%E4%B8%8Adebug-spark-standalone/转载请注明来自:http://www.cnblogs.com/yuananyun/p/4265706.html 研究Spark源码也有一段时间了,一直都是直接看代码,没有调试。虽然带
2015-02-01 18:01:21 36391 7
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人