Hive
文章平均质量分 83
Wang_AI
这个作者很懒,什么都没留下…
展开
-
Hive优化总结
1.Hive表优化1.1 分区分区是以字段的形式在表结构中存在,通过describe table命令可以查看到字段存在, 但是该字段不存放实际的数据内容,仅仅是分区的表示(伪列)。1.1.1静态分区create table if not exists tablename(id int,name string,tel string)partitioned by(dt string)原创 2016-03-12 19:44:58 · 944 阅读 · 0 评论 -
Hive--自定义函数
6 函数原创 2016-03-12 14:20:57 · 1007 阅读 · 0 评论 -
关于Hive的练习
现在来练习下Hive中的一些常用内置函数先来查看下表winfunc:hive (default)> desc winfunc;OKcol_name data_type commentid int money float原创 2016-03-11 21:01:20 · 1003 阅读 · 0 评论 -
Hive--HiveQL:查询
4 查询4.1 select...from语句 select是SQL的射影算子,from子句标识了从哪个表、视图或嵌套查询中选择记录。原创 2016-03-11 09:43:14 · 2359 阅读 · 0 评论 -
Hive--行转列(Lateral View explode())和列转行(collect_set() 去重)
1.行转列1.1 问题引入:如何将a b 1,2,3c d 4,5,6变为:a b 1a b 2a b 3c d 4c d 5c d 6 1.2 原始数转载 2016-03-11 11:29:04 · 31719 阅读 · 3 评论 -
Hive--HiveQL:数据定义、数据操作
2 数据定义2.1 Hive中的数据库(database) Hive中的数据库的概念本质上仅仅是表的一个目录或者命名空间。查看Hive中的所有数据库:show databases;hive (default)> show databases;创建数据库:create database [if not exists] database_name;hive (d原创 2016-03-11 09:29:00 · 1932 阅读 · 0 评论 -
Hive--基础操作、数据类型和文本文件格式
11.1 配置.hiverc文件 H在${HIVE_HOME}/bin目录下有个.hiverc文件,它是隐藏文件,我们可以用Linux的ls -a命令查看。我们在启动Hive的时候会去加载这个文件中的内容,所以我们可以在这个文件中配置一些常用的参数。#在命令行中显示当前数据库名set hive.cli.print.current.db=true; #查询出来的结果显示列的名称原创 2016-03-10 22:15:46 · 1789 阅读 · 0 评论