Hive
关于Hive,包括基础,案列等
丿沐染烟忱丶
昨夜西风凋碧树,独上高楼,望尽天涯路!
衣带渐宽终不悔,为伊消得人憔悴!
众里寻他千百度。蓦然回首,那人却在灯火阑珊处!
展开
-
Hive自定义函数
概述UDF函数其实就是一个简单的函数,执行过程就是在Hive转换成MapReduce程序后,执行java方法,类似于像MapReduce执行过程中加入一个插件,方便扩展。目前Hive除去一些内置的函数以外,还提供了一些内置的函数的扩扎接口:UDF:针对单行数据操作,需要继承UDFUDTF:操作一个数据行,产生多个数据行或者是多个列,需要用户继承GenericUDTF引依赖<depe...原创 2020-01-13 21:19:32 · 125 阅读 · 0 评论 -
Hive on Hbase
首先需要启动HDFS、zk、yarn、Hbase。habse clean --cleanAll //清除zookeeper的信息创建表 需要在Hbase中先创建"baizhi:t_employee"create external table t_employee_hbase(empno INT, ename STRING, job STRING, mgr IN...原创 2020-01-13 20:18:37 · 233 阅读 · 0 评论 -
Hive中开窗函数的案例
数据信息0: jdbc:hive2://Hbase:10000> select empno,ename,sal,deptno from t_employee;+--------+---------+-------+---------+--+| empno | ename | sal | deptno |+--------+---------+-------+-------...原创 2020-01-13 17:57:15 · 212 阅读 · 0 评论 -
Hive案例:影评
数据准备数据下载链接:https://github.com/qianhonglinIT/HiveMovieCaseStudy在数据库中创建3张表,t_user,t_movie,t_ratingcreate table t_user(userid bigint,sex string,age int,occupation string,zipcode string) row for...原创 2020-01-12 17:38:01 · 776 阅读 · 0 评论 -
Hive sql案例(二)
行转列数据准备1,语文,1001,数学,1001,英语,1002,数学,792,语文,802,英语,100CREATE TABLE t_student( id INT, course STRING, score double)row format delimitedfields terminated by ','collection items te...原创 2020-01-12 11:46:28 · 122 阅读 · 0 评论 -
Hive sql案例(一)
数据员工数据7369,SMITH,CLERK,7902,1980-12-17 00:00:00,800,\N,207499,ALLEN,SALESMAN,7698,1981-02-20 00:00:00,1600,300,307521,WARD,SALESMAN,7698,1981-02-22 00:00:00,1250,500,307566,JONES,MANAGER,7839,198...原创 2020-01-12 11:36:41 · 491 阅读 · 0 评论 -
Hive-DML操作
加载文件数据到表中LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)]load data local inpath "/root/baizhi/t_employee" overwrite into table t_e...原创 2020-01-10 21:20:40 · 146 阅读 · 0 评论 -
Hive常规操作(DDL、DML)
DDLDataBase1.查看数据库0: jdbc:hive2://Hbase:10000> show databases;+----------------+--+| database_name |+----------------+--+| default || test |+----------------+--+2 rows s...原创 2020-01-10 20:49:39 · 185 阅读 · 0 评论 -
Hive的安装、操作
Hive的安装由于hive需要存储一些一些建表的元数据信息,因此在生产环境下安装Hive需要事先安装MySQL数据库服务(注意:MySQL数据库的编码必须是Latin1编码)。其次Hive是构建在Hadoop存储和计算之上的工具,因此还需要在配置和安装hive之前保证Hadoop的hdfs和MapReduce正常运行。最后Hive的安装主机上必须配置HADOOP_HOME环境变量,这样Hive可...原创 2020-01-09 22:01:28 · 321 阅读 · 0 评论 -
Hive基础
概述1.什么是HiveHive是建立在Hadoop上的数据仓库基础架构。可以将结构化的数据映射为一张数据库表,并提供类SQL查询功能。详解Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的SQL查询功能,可以将SQL语句转换为MapReduce任务进行运行。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查...原创 2020-01-09 21:43:10 · 141 阅读 · 0 评论