- 博客(5)
- 资源 (31)
- 收藏
- 关注
转载 Hive元数据解析
本文是笔者初步整理的Hive元数据表,有不准确的地方请轻拍,后续我会补充.1. Hive 0.11 元数据表汇总线上Hive 0.11 metastore包括下述39个表,主要分为以下几类 : Database相关 Table相关 数据存储相关SDS COLUMN相关 SERDE相关(序列化)
2013-12-17 21:13:53 1079
转载 Hive 元数据“waiting for table metadata lock”
最近hive元数据统计时,老出现“waiting for metadata lock”,造成hive查询、统计的sql执行失败。现象:33692473 hiveadmin 10.5.18.226:5176 dataplatform_hive Query 13316 Waiting for table metadata lock SELECT 'org.apache.hadoop.hive.
2013-12-17 20:55:16 1878
转载 监控HBase集群
任何生产系统的一个关键点就是运维人员监控其状态和表现的能力。当问题发生时,运维人员最不希望做的事情就是筛查数GB或TB的日志来搞清楚系统的状态和问题的根源。没有人愿意为搞清楚发生了什么情况而去阅读跨多台服务器的成千上万行日志记录。这种情况下,你记录的详细指标开始发挥作用。在一个像HBase这样达到生产品质的数据库里发生着很多事情,每件事情可以用不同的方法进行测量。这些测量结果被系统输出出来,可以被
2013-12-02 22:29:28 2486 1
转载 交互式大数据处理模型-Google Dremel
背景在大数据时代的背景下,数据是显得如此丰富和可爱。而理所当然的,大数据的存储和计算就是其相关业务的两大亮点了。总结业界一些处理大数据的方式,做了如下比较。此次,我主要介绍Google Dremel。值得一提的是,Drill是Dremel的开源版本,Google自己的OpenDremel也整合到了Drill中,不过Drill还在Apache孵化器里,得到阶段性的成果还需要一段时间。
2013-12-02 20:56:31 3421
转载 Ganglia分布式集群监控系统安装手册
一、Ganglia分布式监控系统简介Ganglia是UC Berkeley发起的一个开源集群监视项目。它主要是用来监控系统性能,如:CPU 、Memory、硬盘利用率, I/O负载、网络流量情况等。Ganglia通过图形化的方式展示每个节点的状态信息,这对合理调整、分配系统资源,提高系统整体性能起到重要作用。Ganglia包含三个核心组件:Ganglia Monitoring Daemon
2013-12-02 20:53:30 1518
Oracle知识库
2012-10-24
Java 优化编程
2012-08-07
Oracle调优心得
2012-08-07
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人