hive
文章平均质量分 81
zuolixiangfisher
有空一起钓鱼啊
展开
-
hive基本介绍以及性能优化
一、介绍 hive是建立在Hadoop上的数据仓库基础架构。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在Hadoop中大规模数据的机制。最大的有点就是定义了类SQL语言,称为HQL。 使用HQL作为查询接口 使用HDFS作为底层存储 使用MapReduce作为执行层 1.1 结构描述 hive的结构可以分为以下几部分: 用户接口:原创 2015-08-28 16:57:23 · 394 阅读 · 0 评论 -
Hive各类分析函数的使用实例
1、求累积分布函数 sum + over cookie create_time pv cookie1, 2015-04-10, 1 cookie1, 2015-04-11, 5 cookie1, 2015-04-12, 7 cookie1, 2015-04-13, 3 cookie1, 2015-04-14, 2 cookie1, 2015-04-15, 4 cookie1, 2...原创 2019-04-17 09:58:30 · 888 阅读 · 0 评论