Hive
文章平均质量分 87
匿名啊啊啊
这个作者很懒,什么都没留下…
展开
-
Hive的函数
在Hive中,函数包括以下类型:一、内置函数1、数学函数(1)round:四舍五入 select round(数值,小数点位数); (2)ceil:向上取整 select ceil(45.6); --46 (3)floor:向下取整 select floor(45.6); --45 2、字符函数(1)lower:转成小写 ...原创 2018-04-10 21:33:36 · 261 阅读 · 0 评论 -
hive自定义函数
hive的自定义函数包括UDF,UDAF,UDTF三种类型1、UDF是单行函数自定义时需要继承UDF类,然后实现evaluate方法即可代码例子:package test; import java.util.ArrayList; import org.apache.hadoop.hive.ql.exec.UDF; public class ConnStr2 ex...原创 2018-05-02 21:31:43 · 1945 阅读 · 0 评论 -
Hive学习(五)-Hive全操作
1、建库 create database mydb; create database if no exists mydb; create database if no exists mydb location "/aa/bb";2、查询数据库 查询库列表:show databases; 查询库详细信息:desc database [extended] mydb; 查询建库的详细信息:sho...原创 2018-04-07 12:46:46 · 872 阅读 · 1 评论 -
Hive学习(四)Hive的DDL操作
目录1、DDL 操作1.1、库操作1.1.1、创建库1.1.2、查看库1.1.3、删除库1.1.4、切换库1.2、表操作1.2.1、创建表1.2.2、查看表1.2.3、修改表1.2.4、删除表1.2.5、清空表21.3、其他辅助命令正文:1、DDL 操作1.1、库操作1.1.1、创建库语法结构:CREATE (DATABASE|SCHEMA) [IF NOT EXISTS] database_na...原创 2018-04-06 16:54:53 · 620 阅读 · 0 评论 -
Hive学习 (三)Hive的连接三种连接方式
目录一、CLI连接二、HiveServer2/beeline 1、修改 hadoop 集群的 hdfs-site.xml 配置文件 2、修改 hadoop 集群的 core-site.xml 配置文件三、Web UI正文:一、CLI连接进入到 bin 目录下,直接输入命令:[potter@potter2 ~]$ hiveSLF4J: Class path contains multi...原创 2018-04-06 15:13:15 · 14968 阅读 · 3 评论 -
Hive shell 操作
目录1、Hive shell 操作1.1、Hive 命令行1.2、Hive 参数配置方式1、Hive shell 操作1.1、Hive 命令行这是 hive 支持的一些命令:Command Descriptionquit Use quit or exit to leave the interactive shell. set key=value Use this to set value of...原创 2018-04-11 22:45:18 · 2128 阅读 · 0 评论 -
Hive学习(二)基础知识
目录1、Hive 基本概念1.1、Hive 简介 1.1.1、什么是 Hive1.1.2、为什么使用 Hive1.1.3、Hive 特点1.2、Hive 和 RDBMS 的对比1.3、Hive 架构1.4、Hive 的数据存储 1、Hive 基本概念1.1、Hive 简介1.1.1、什么是 HiveHive 由 Facebook 实现并开源,是基于 Hadoop 的一个数据仓库工具,可以将结构化的...原创 2018-04-03 20:29:10 · 1043 阅读 · 0 评论 -
Hive学习(一)环境搭建
1、Hive 安装搭建hive的开发环境安装HIVE之前, 一定要保证hadoop集群启动正常 必须准备两个前提; 1、hadoop 集群 2、一个关系型数据库 推荐使用MySQL 安装Mysql:https://blog.csdn.net/qq_41851454/article/details/79731930找Hive安装包的方式:进入官网:https://hive.a...原创 2018-04-03 19:45:48 · 3059 阅读 · 0 评论 -
hadoop、hive小文件合并
小文件是指文件size小于HDFS上block大小的文件。这样的文件会给hadoop的扩展性和性能带来严重问题。首先,在HDFS中,任何block,文件或者目录在内存中均以对象的形式存储,每个对象约占150byte(元数据的记录),如果有1000 0000个小文件,每个文件占用一个block,则namenode大约需要2G空间。如果存储1亿个文件,则namenode需要20G空间。这样nameno...原创 2018-04-10 21:37:20 · 2680 阅读 · 0 评论 -
Hive学习(六)数据仓库的表设计
数据仓库的起源可以追溯到计算机与信息系统发展的初期。它是信息技术长期复杂演化的产物,并且直到今天这种演化仍然在继续进行着。而数据仓库容易让人糊涂的地方在于它是一种体系结构,而不是一种技术。这点使得许多技术人员和风投都感到沮丧,因为他们希望的是打好成包的专业技术,而非具有哲学意义的体系架构。 本系列旨在于讲述Hive搭建数据仓库过程中的一些要点,所以希望读者理解Hive和数据仓库的区别和联系。 Hi...原创 2018-06-01 21:53:28 · 5924 阅读 · 2 评论