![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
hive
一度凡尘
这个作者很懒,什么都没留下…
展开
-
Hive简介
转自 http://www.yiibai.com/hive/ 教程笔记hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。 https转载 2017-08-19 11:29:57 · 585 阅读 · 0 评论 -
Hive视图和索引
1、视图可以是任何结果集的数据,创建一个视图可以方便数据的查询,创建视图的语法如下: CREATE VIEW [IF NOT EXISTS] view_name [(column_name [COMMENT column_comment],…)] [COMMENT table_comment] AS SELECT … 创建emp_45000视图,满足salary大于45000的结果集。 CR原创 2017-09-20 17:55:45 · 620 阅读 · 0 评论 -
Hive 连接查询JOIN
JOIN字句用于通过使用共同值来组合来自多个表的字段类似于SQL中的JOIN,具有JOIN、LEFT OUTER JOIN、RIGHT OUTER JOIN、FULL OUTER JOIN四种连接,基本语法如下:table_reference JOIN table_factor [join_condition] | table_reference {LEFT|RIGHT|FULL} [OUTE原创 2017-09-20 17:54:09 · 5570 阅读 · 0 评论 -
Hive查询
1、Hive的查询与SQL类似,基本语法如下: SELECT [ALL | DISTINCT] select_expr, select_expr, ... FROM table_reference [WHERE where_condition] [GROUP BY col_list] [HAVING having_condition] [CLU原创 2017-09-20 16:32:15 · 781 阅读 · 0 评论 -
Hive内置运算符
Hive的内置运算符分为四种类型: 关系运算符、算术运算符、逻辑运算符、复杂运算符 1、关系运算符 运算符 操作 描述 A = B 所有基本类型 如果表达A等于表达B,结果TRUE ,否则FALSE。 A != B 所有基本类型 如果A不等于表达式B表达返回TRUE ,否则FALSE。 A < B 所有基本类型 TRUE,如果表达式A小转载 2017-09-20 16:25:19 · 2393 阅读 · 0 评论 -
Hive内置函数
1、内置函数:返回类型 签名 描述BIGINT round(double a) 返回BIGINT最近的double值。BIGINT floor(double a) 返回最大BIGINT值等于或小于double。BIGINT ceil(double a) 它返回最小BIGINT值等于或大于double。double rand(), rand(int转载 2017-09-20 16:27:32 · 514 阅读 · 0 评论 -
Hive分区
hive对表进行分区,如按照日期,城市等方式区分,可以起到提升查询速度的作用。 创建一个新的employee表,存储如下数据:id, name, dept1 lllis tp 2 sssll hr 3 jslsj sc 4 lslsl sc 然后我们按照年份来对数据进行分区存储。 1、原创 2017-08-29 17:27:49 · 14804 阅读 · 0 评论 -
Hive插入数据
1、创建完表之后,就可以插入数据了,在hive中,一般使用LOAD DATA插入数据,数据来源一般为两种,一种是从本地文件系统,第二种是从hadoop文件系统。基本语法如下:LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename[PARTITION (partcol1=val1,partcol2=val2,…)]LOC原创 2017-08-29 17:17:44 · 20814 阅读 · 2 评论 -
Hive创建表
1、Create Table 命令用于在hive中创建表,语法如下:CREATE [TEMPORARY] [EXTERNAL] TABLE [IF NOT EXISTS] [db_name.] table_name[(col_name data_type [COMMENT col_comment], ...)][COMMENT table_comment][ROW FORMAT row_for原创 2017-08-29 17:13:40 · 3118 阅读 · 0 评论 -
Hive创建、删除数据库
1、使用hive客户端命令创建表,命令如下: 注:发现hive客户端和hiveserver2不能同时使用,但可以使用beeline。 beeline使用如下: 输入命令:beeline 然后输入连接命令: !connect jdbc:hive2://localhost:11111 提示输入用户名密码直接回车即可; 验证是否成功: CREATE DATABASE | SCHEMA原创 2017-08-29 17:10:52 · 31012 阅读 · 0 评论 -
Hive数据类型
http://www.yiibai.com/hive/Hive所有数据类型分为四种类型: 列类型、文字、Null值、复杂类型 1、列类型 整形 TINYINT(Y) SMALLINT(S) INT BIGINT(L) 字符串类型 VARCHAR(1-65535) CHAR(255) 时间戳 Timestamp(YYYY-MM-DD HH:MM:SS.ffffffff)转载 2017-08-19 14:03:57 · 646 阅读 · 0 评论 -
Python操作Hive准备
教程中使用的是Java操作hive,而我的需求是使用python操作hive,所以需要进行简单的环境配置。 使用python操作hive有两种方式: Thrift api方式和python hive相关的包 1、Thrift api方式 根据介绍,只需要把hive/lib/py包下的文件全部拷贝到python的扩展库文件夹下即可site-packages。 拷贝完成后,启动hiveserv原创 2017-08-19 11:44:45 · 3968 阅读 · 0 评论 -
Hive安装
安装Hive之前必须确认Java、hadoop都已经安装成功,之前已经安装过,不再累述。 1、安装Hive 下载hive安装包,下载路径如下: http://mirrors.hust.edu.cn/apache/hive/hive-1.2.2/apache-hive-1.2.2-bin.tar.gz 下载文件后,进入root用户,解压文件,将文件拷贝到/usr/local/目录下,更该名称为原创 2017-08-19 11:36:32 · 453 阅读 · 0 评论 -
Hive修改数据表
Alter Table命令用来修改hive中的表结构,基本格式如下:ALTER TABLE name RENAME TO new_name ALTER TABLE name ADD COLUMNS (col_spec[, col_spec ...]) ALTER TABLE name DROP [COLUMN] column_name ALTER TABLE name CHA原创 2017-08-29 17:23:06 · 15371 阅读 · 0 评论