-
hive的基本思想
hive是基于Hadoop的一个数据仓库工具(离线),可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。
hadoop处理结构化数据的数据仓库
不是关系型数据库,不适合OLTP在线事务处理,例如银行
不适合实时查询和行级更新。
总结:hive具有sql数据库的外表,但应用场景完全不同,hive只适合用来做批量数据统计分析 -
Hive的特点
可扩展
Hive可以自由的扩展集群的规模,一般情况下不需要重启服务。延展性
Hive支持用户自定义函数,用户可以根据自己的需求来实现自己的函数。容错
良好的容错性,节点出现问题SQL仍可完成执行。 -
启动服务
nohup bin/hiveserver2 1>/dev/null 2>&1 & 后台启动,只要别的客户端连接上它就可以,可以多个beeline客户端
hive客户端不支持并发访问,同时起两个塞住了可以用beeline -
连接
!connect jdbc:hive2//s201:10000
直接连接
bin/beeline -u jdbc:hive2://s201:10000 -n root
s201是你登录这台机器的主机名字
在hive命令模式下可以用 dfs -put … 等命令操作hdfs
mysql复制表 create table tt as select * from users ; //携带数据和表结构
mysql复制表 create table tt like users ; //不带数据,只有表结构
hive2.0 以后执行引擎换成了spark
hive知识点
最新推荐文章于 2023-03-12 18:08:15 发布
hive的基本思想hive是基于Hadoop的一个数据仓库工具(离线),可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。hadoop处理结构化数据的数据仓库不是关系型数据库,不适合OLTP在线事务处理,例如银行不适合实时查询和行级更新。总结:hive具有sql数据库的外表,但应用场景完全不同,hive只适合用来做批量数据统计分析Hive的特点可扩展Hive...
摘要由CSDN通过智能技术生成