![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Hive
文章平均质量分 97
菜鸟也学大数据
这个作者很懒,什么都没留下…
展开
-
Hive介绍、架构、实践以及调优
一、什么是Hive 1.1 介绍 hive是基于Hadoop构建的一套数据仓库分析系统,它提供了丰富的SQL查询方式来分析存储在Hadoop分布式文件系统中的数据。 可以将结构化的数据文件映射为一张数据库表,并提供完整的SQL查询功能。 可以将SQL语句转换为MapReduce任务运行,通过自己的SQL查询分析需要的内容,这套SQL简称Hive SQL,使不熟悉mapreduce的用户可以很方便地利用SQL语言查询、汇总和分析数据。 1.2 特点 可扩展: Hive可以自由的扩展集群的规模,一般情况下不原创 2021-01-18 01:03:34 · 629 阅读 · 0 评论 -
Hive UDF的学习与使用
本篇仅展示UDF完整的操作流程,不包含UDF的具体开发内容 UDF简述 Hive中本身自带很多函数供开发人员使用,但现实情况中,有些特殊情景需要特定的操作,而Hive函数本身是支持扩展的,所以UDF就是自定义函数,在HIve中使用的一种方式 流程步骤 继承UDF类或GenericUDF类 重写evaluate()方法并实现函数逻辑 编译打包为jar文件 复制到正确的HDFS路径 使用jar创建临时/永久函数 调用函数 一.新建maven项目 第一步:新建项目选择maven 第二步:设置.原创 2020-10-06 20:30:07 · 611 阅读 · 0 评论 -
Hive的安装与配置
准备文件 hive包:hive-1.1.0-cdh5.14.2.tar.gz mysql驱动包:mysql-connector-java-5.1.38.jar 第一步:解压hive包tar -zxvf [hive包] -C /解压到的路径 第二步:在hive目录下新建warehouse目录mkdir warehouse 第三步:修改etc/profile配置文件vi /etc/profile #增加内容 export HIVE_HOME=/HIVE的安装路径 export PATH=...:$HIV原创 2020-09-23 17:40:15 · 327 阅读 · 0 评论