- 博客(4)
- 资源 (28)
- 收藏
- 关注
原创 Impala介绍,Impala架构,Impala安装,impala Shell ,分区创建,refresh,load数据,获取数据的元数据
1 ImpalaImpala是Cloudera公司主导开发的新型查询系统,它提供SQL语义,能查询存储在Hadoop的HDFS和HBASE中的PB级大数据。已有的Hive系统虽然也提供了SQL语义,但由于Hive底层执行使用的是MapReduce引擎,仍然是一个批处理过程,难以满足查询的交互性。相比之下,Impala的最大特点也是最大卖点就是它的快速。Impala到底是什么?Impala是用...
2019-10-17 14:25:19 1525
原创 datax安装+配置+使用文档
1 DataX离线同步工具DataX3.0介绍DataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括 MySQL、Oracle、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、MaxCompute(ODPS)、DRDS 等各种异构数据源之间高效的数据同步功能。Github地址:https://github.com/a...
2019-10-17 12:31:16 73394 10
原创 Apache Tez介绍,术语,安装,监控等
目录1 Apache Tez 11.1 Apache Tez介绍 11.2 术语介绍 11.3 软件准备 21.4 设置tez-ui 31.4.1 找到war包 31.4.2 将tez-ui部署在tomcat 41.4.3 配置timelineserver 51.4.4 启动hadoop 61.4.5 5.启动timelineserver 61.4.6 启动tomcat 7...
2019-10-17 10:54:04 1184
原创 Elasticsearch和Hive整合,将hive数据同步到ES中
1 Elasticsearch整合Hive1.1 软件环境Hadoop软件环境Hive软件环境ES软件环境1.2 ES-Hadoop介绍1.2.1 官网https://www.elastic.co/cn/products/hadoop1.2.2 对 Hadoop 数据进行交互分析Hadoop 是出色的批量处理系统,但是要想提供实时结果则颇具挑战。为了实现真正的交互式数据探索,...
2019-10-17 10:40:34 12422 4
easyui资料
2014-02-22
17个在线编辑器,包括kindeditor,STEditor,HTMLArea3.0last20071025等
2012-07-22
二手购物网源码
2012-05-31
强大的购物网代码(java)
2012-05-30
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人