Hive
文章平均质量分 62
疯狂学习的白菜
途虽远,我必达!
展开
-
大数据之hive(四) --- function ,UDF 用户自定义函数 ,GenericUDF ,自定义NVL函数,自定义日期函数
一、function 函数-------------------------------------------------------------------- 1.显示所有函数 $hive> show functions; 2.查看函数的帮助 $hive> desc function cos; 3.表生成函数 ...原创 2018-09-11 14:48:34 · 705 阅读 · 0 评论 -
大数据之hive(一) --- hive介绍,特点,架构,组件,安装部署,hive的命令行操作(增删改查)
一、hive介绍------------------------------------------ 1.在hadoop上处理结构化数据的一种数据仓库 2.用于总结,查询和分析大数据 3.不是关系型数据库,不适用在线事务处理OLTP,不支持实时查询和行级更新 4.运行在hadoop上二、hive特点-------------------------...原创 2018-09-08 20:57:53 · 330 阅读 · 0 评论 -
大数据之hive(二) --- hiveserver2,JDBC连接操作hive,表增删改查,常用聚集查询,beeline客户端,分区表,桶表,连接查询
一、启动hiveserver2服务:专门针对远程套接字连接的服务---------------------------------------------------------- 1.$> hive --service hiveserver2 start & //后台运行服务 2.$> netstat -ano | grep 10000 ...原创 2018-09-09 18:46:06 · 1340 阅读 · 0 评论 -
大数据之hive(三) --- 导入导出,排序聚集查询,hive上实现WordCount,Transactions,View,MapJoin,hive调优
一、export/import 导出表/导入表--------------------------------------------------- $hive> EXPORT TABLE p1 TO '/user/ubuntu/data/ex'; //导出到hdfs上,而且目录必须为空 $hive> IMPORT FROM '/user/ubuntu/...原创 2018-09-10 18:07:46 · 204 阅读 · 0 评论 -
大数据之Spark(五)--- Spark的SQL模块,Spark的JDBC实现,SparkSQL整合MySQL,SparkSQL整合Hive和Beeline
一、Spqrk的SQL模块---------------------------------------------------------- 1.该模块能在Spack上运行Sql语句 2.可以处理广泛的数据源 3.DataFrame --- RDD --- table //数据框 4.可以使用SQL语句和DataFrameAPI,访问数据库二、...原创 2018-11-08 12:48:25 · 650 阅读 · 0 评论