hive知识点

hive的基本思想hive是基于Hadoop的一个数据仓库工具(离线),可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。hadoop处理结构化数据的数据仓库不是关系型数据库,不适合OLTP在线事务处理,例如银行不适合实时查询和行级更新。总结:hive具有sql数据库的外表,但应用场景完全不同,hive只适合用来做批量数据统计分析Hive的特点可扩展Hive...
摘要由CSDN通过智能技术生成
  1. hive的基本思想

    hive是基于Hadoop的一个数据仓库工具(离线),可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。
    hadoop处理结构化数据的数据仓库
    不是关系型数据库,不适合OLTP在线事务处理,例如银行
    不适合实时查询和行级更新。
    总结:hive具有sql数据库的外表,但应用场景完全不同,hive只适合用来做批量数据统计分析

  2. Hive的特点

    可扩展
    Hive可以自由的扩展集群的规模,一般情况下不需要重启服务。

    延展性
    Hive支持用户自定义函数,用户可以根据自己的需求来实现自己的函数。

    容错
    良好的容错性,节点出现问题SQL仍可完成执行。

  3. 启动服务

    nohup bin/hiveserver2 1>/dev/null 2>&1 & 后台启动,只要别的客户端连接上它就可以,可以多个beeline客户端
    hive客户端不支持并发访问,同时起两个塞住了可以用beeline

  4. 连接

    !connect jdbc:hive2//s201:10000
    直接连接
    bin/beeline -u jdbc:hive2://s201:10000 -n root
    s201是你登录这台机器的主机名字
    在hive命令模式下可以用 dfs -put … 等命令操作hdfs
    mysql复制表 create table tt as select * from users ; //携带数据和表结构
    mysql复制表 create table tt like users ; //不带数据,只有表结构
    hive2.0 以后执行引擎换成了spark

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值