- 博客(3)
- 资源 (1)
- 收藏
- 关注
转载 SparkSQL On Yarn with Hive,操作和访问Hive表
SparkSQL On Yarn with Hive,操作和访问Hive表
2017-04-23 23:30:34 845
转载 hive优化
hive的查询注意事项以及优化总结 .Hive是将符合SQL语法的字符串解析生成可以在Hadoop上执行的MapReduce的工具。使用Hive尽量按照分布式计算的一些特点来设计sql,和传统关系型数据库有区别,所以需要去掉原有关系型数据库下开发的一些固有思维。基本原则:1:尽量尽早地过滤数据,减少每个阶段的数据量,对于分区表要加分区,同时只选择需要使用到的字段sele
2017-04-20 10:36:04 301
转载 HBase详细概述
本文首先简单介绍了Hbase,然后重点讲述了HBase的高并发和实时处理数据 、HBase数据模型、HBase物理存储、HBase系统架构,HBase调优、HBase Shell访问等。不过在此之前,你可以先了解 Hadoop生态系统 ,若想运行HBase,则需要先搭建好Hadoop集群环境,可以参考此文搭建5个节点的hadoop集群环境(CDH5) 。好了,让我们来学习HBase吧!...
2017-04-05 21:11:26 810
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人