大数据
文章平均质量分 83
其实我是程序员
这个作者很懒,什么都没留下…
展开
-
Hive入门学习
一、HIVE概念。1.Hadoop一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的类SQL查询功能,可以将HQL语句转换为MapReduce任务进行运行。2.Hive适用于大数据集的批处理作业,例如:网络日志分析。不适用于:不能在大规模数据集上实现低延迟快速的查询。例如:Hive在几百MB的数据集上执行查询一般有分钟级的延迟。不支持联机事务处理。(OLTP)3.Hive是基于Hadoop分布式文件系统的,它的数据存储在Hadoop分布式文件系统中。Hive本身是没有专门原创 2022-04-06 14:56:51 · 1753 阅读 · 0 评论 -
HBase入门
一、概览HBase是一个分布式的,面向列的开源数据库。它更像是分布式存储而不是分布式数据库,它缺少很多RDBMS系统的特性,比如列类型,辅助索引,触发器,和高级查询语言等。那Hbase有什么特性呢?如下:强读写一致,但是不是“最终一致性”的数据存储,这使得它非常适合高速的计算聚合。.自动分片,通过Region分散在集群中,当行数增长的时候,Region也会自动的切分和再分配自动的故障转移。Hadoop/HDFS集成,和HDFS开箱即用,不用太麻烦的衔接丰富的“简洁,高效”API,Thrift原创 2021-01-08 14:40:01 · 322 阅读 · 0 评论