Hive SQL总结(大数据学习18)

没有关注的小伙伴可以在微信搜索框中搜索微信公众号: 

3分钟秒懂大数据,然后点击关注,回复 Hive SQL总结  即可免费领取Hive SQL总结(大数据学习18)全部文档!!!

图片

一. HIVE启动的两种方式 :1 直接启动  2 Hive thrift服务

1 Hive 直接启动: 找寻你所安装的hive文件下的hive驱动  我的驱动是在 apps/apache-hive-1.2.1-bin/hive 下  执行驱动就可以将hive启动起来

[hadoop@mini1 ~]$ cd apps/apache-hive-1.2.1-bin/

[hadoop@mini1 apache-hive-1.2.1-bin]$ bin/hive

Hive thrift服务: 将hive作为一个服务器,通过另一个节点用beeline去连接 具体操作如下:

[hadoop@mini1 ~]$ cd apps/apache-hive-1.2.1-bin/
[hadoop@mini1 apache-hive-1.2.1-bin]$ bin/hiveserver2    //先作为服务器启动

    重新开一个mini1窗口   

[hadoop@mini1 ~]$ cd apps/apache-hive-1.2.1-bin/
[hadoop@mini1 apache-hive-1.2.1-bin]$ bin/beeline   //先启动beeline节点,然后在连接你启动的hive服务器

// 当进去beeline节点后执行下面操作

beeline> !connect jdbc:hive2://localhost:10000
Connecting to jdbc:hive2://localhost:10000
Enter username for jdbc:hive2://localhost:10000: hadoop   //该账号为你登录的服务器用户名
Enter password for jdbc:hive2://localhost:10000: ******   //密码为服务器密码



  

  • 14
    点赞
  • 88
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: Hadoop、Hive和Spark都是大数据框架,但它们的作用和特点有所不同。 Hadoop是一个分布式计算框架,用于存储和处理大规模数据集。它包括HDFS(Hadoop分布式文件系统)和MapReduce计算模型。Hadoop适用于批处理任务,可以处理大量的数据,但处理速度较慢。 Hive是一个基于Hadoop的数据仓库工具,它提供了类似于SQL的查询语言,可以将结构化数据映射到Hadoop上。Hive适用于数据分析和查询,可以将数据转换为易于理解的格式,但处理速度较慢。 Spark是一个快速、通用、分布式计算引擎,可以处理大规模数据集。它支持多种编程语言,包括Java、Scala和Python等。Spark适用于实时数据处理和机器学习等任务,处理速度较快。 因此,Hadoop、Hive和Spark都是大数据框架,但它们的作用和特点有所不同,可以根据具体的需求选择合适的框架。 ### 回答2: Hadoop、Hive和Spark都是大数据处理中常用的框架,它们的联系和区别如下: 联系: 1. 都是开源软件,由Apache基金会进行维护和开发。 2. 都是针对大数据处理的,能够处理海量的数据。 3. 都能在云端和本地部署运行,可以运行于各种操作系统。 4. 都提供了分布式计算和存储功能,支持并行计算。 区别: 1. Hadoop主要用于分布式存储和批处理,是一个计算框架,可以通过MapReduce计算模型来执行任务,支持大数据文件的分割和分布式存储。 2. Hive则是基于Hadoop的数据仓库软件,提供了类SQL语言(HiveQL)查询工具,可以将结构化数据映射到Hadoop中进行处理。 3. Spark是一种计算引擎,用于处理数据的实时流式计算,提供了并行处理和内存计算功能,不需要像Hadoop一样将数据写入磁盘,因此,在速度上比Hadoop和Hive更快。 因此,Hadoop主要用于数据处理和存储,Hive主要用于数据查询和分析,而Spark则是一种更为快速的数据处理框架。当然,在实际的大数据处理应用中,通常综合使用这些框架来处理不同的场景下的数据需求。 ### 回答3: Hadoop、Hive、Spark 都是大数据处理的框架,但是他们有着不同的设计思想和应用场景。下面分别介绍它们的联系和区别: 联系: Hadoop 是一个采用 MapReduce 编程模型的分布式计算框架,其核心是 HDFS(Hadoop Distributed File System),主要用于实现大规模数据的存储和计算。 Hive 是一个采用类 SQL 语言 HQL(Hive Query Language)的数据仓库工具,其底层数据存储在 HDFS 上,可以通过类 SQL 语句查询数据。 Spark 也是一个分布式计算框架,但是其采用的是基于内存的计算模型,具有快速、高效的特点,常用于机器学习等复杂计算场景。 区别: 1. 编程模型:Hadoop 采用的是 MapReduce 编程模型,而 Hive 支持 SQL 类型的数据处理,而 Spark 采用更为高级的 RDD(Resilient Distributed Dataset)编程模型和运算符。 2. 计算效率:Hadoop 在大数据处理上表现出优秀的可扩展性,但是处理速度相对较慢。Hive 的数据处理速度相对较快,但是也比较受到数据格式和数据规模的影响。Spark 采用的是基于内存的计算模型,具有快速、高效的特点,但是需要大量的内存资源。 3. 适用场景:Hadoop 适用于大数据存储和计算,对于一些复杂的分布式计算场景比较适合。Hive 适用于针对大规模数据的类 SQL 查询。Spark 适用于速度要求较高的复杂计算场景,如机器学习、数据挖掘等。 4. 开发难易度:Hadoop 开发难度较大,需要自己编写 MapReduce 代码,相对复杂。Hive 容易上手,类似于 SQL 查询,方便用户进行数据分析。Spark 相对于 Hadoop 来说开发难易度有所降低,但是相对于 Hive 来说难度会大一些。 总之,Hadoop、Hive、Spark 各有所长,针对不同的应用场景可以进行选择。在现实的大数据处理任务中,通常会综合考虑各种因素的影响,选择合适的框架以达到更好的效果。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

3分钟秒懂大数据

你的打赏就是对我最大的鼓励

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值