Hive
文章平均质量分 98
欧叶冲冲冲
新的bug已经出现,我们怎能停滞不前
展开
-
【大数据】hive企业级调优(尚硅谷hive3.1.3教程)
hive调优,面试、工作中常用,非常重要。计算资源调优和执行计划调优🥝Explain呈现的执行计划,由一系列Stage组成,这一系列Stage具有依赖关系(执行完一个执行下一个),每个Stage对应一个,或者一个文件系统操作等。若某个Stage对应的一个,其Map端和Reduce端的计算逻辑分别由和进行描述,由一系列的Operator组成,一个Operator代表在Map或Reduce阶段的一个单一的逻辑操作,例如等。下图是由一个执行计划绘制而成:👉常见的Operator及其作用如下。原创 2023-09-16 21:32:52 · 593 阅读 · 1 评论 -
【大数据】Hive函数➕分区分桶表➕hive文件格式和压缩
hive打开本地模式sql语句:set hive.exec.mode.local.auto=true;max/min等,但是数量有限,自己可以通过自定义UDF来方便的扩展。当Hive提供的内置函数无法满足你的业务处理需要时,此时就可以考虑使用用户自定义函数👉参考官方文档UDF一进一出,单行函数UDAF用户自定义聚合函数,多进一出。UDTF用户自定义表生成函数,一进多出。如继承Hive提供的类实现类中的抽象方法在hive的命令行窗口创建函数-- 添加jar。-- 创建function。原创 2023-09-07 21:21:07 · 448 阅读 · 1 评论 -
【大数据】Hive_DDL&DML&select
我的编程语言学习笔记——hive🍉创建数据库(方括号里为可选项)🌰举个例子# 创建一个数据库,不指定HDFS路径# 创建一个数据库,指定HDFS路径# 创建一个数据库,带有dbproperties若不指定路径,其默认路径为🍉查询数据库# 查看数据库信息like表示任意个任意字符,表示或的关系🌰举个例子# 查看详细信息包括dbproperties信息🍉修改数据库用户可以使用命令修改数据库某些信息,其中能够修改的信息包括。需要注意的是:修改数据库location。原创 2023-08-31 11:27:32 · 287 阅读 · 0 评论 -
【大数据】Hive入门➕安装(尚硅谷大数据Hive 3.1.3教程)
hive尚硅谷面试刷题网站✍命令行客户端beeline是Apache Hive提供的一个交互式工具,用于与Hive进行交互式的数据库操作和查询。具体来说,beeline允许用户通过命令行界面连接到Hive服务器,并在该界面下执行Hive SQL语句、查看查询结果、管理数据库和表等。连接到Hive服务器:通过指定连接URL、用户名、密码等信息,可以建立与Hive服务器的连接。原创 2023-08-27 23:26:12 · 2444 阅读 · 1 评论