Hive
小董_不长肉
这个作者很懒,什么都没留下…
展开
-
Hive——窗口函数(开窗函数)
创建好文件:vim business.txt数据准备:jack,2017-01-01,10tony,2017-01-02,15jack,2017-02-03,23tony,2017-01-04,29jack,2017-01-05,46jack,2017-04-06,42tony,2017-01-07,50jack,2017-01-08,55mart,2017-04-08,62mart,2017-04-09,68neil,2017-05-10,12mart,2017-04-11,原创 2021-10-08 15:54:47 · 914 阅读 · 0 评论 -
Hive——over(窗口函数)详解
over()over() 函数在Hive中运用广泛,通常搭配row_number() ,min(),max(),sum()来使用,总结下over函数划定窗口的范围over() 因为没设置窗口范围,此时每一行的窗口都是所有的行。SELECT id, name, num, sum(num) over() sum1 from aa也就是每一行后面的sum1是对所有行的num进行sum(num)操作,如果设置好窗口范围,每一行后面的结果是对以当前行为中心按照窗口范围内的行进行sum(转载 2021-10-08 10:46:12 · 1828 阅读 · 0 评论 -
Hive——函数-Explode(含案例演示建议收藏)
创建文件vim movie.txt数据准备:《疑犯追踪》 悬疑,动作,科幻,剧情《Lie to me》 悬疑,警匪,动作,心理,剧情《战狼 2》 战争,动作,灾难创建新表:create table movie_info( movie string, category string)row format delimited fields terminated by "\t";数据导入:load data local inpath "/opt/module/d原创 2021-10-05 15:32:32 · 528 阅读 · 0 评论 -
Hive——函数-拼接字符串(含案例演示建议收藏)
案例一、创建一个新的文件:emp_sex.txtvim emp_sex.txt数据准备悟空,A,男大海,A,男宋宋,B,男凤姐,A,女婷姐,B,女婷婷,B,女创建新的表用于存储数据create table emp_sex(name string, dept_id string, sex string) row format delimited fields terminated by ",";导入数据load data local inpath'/opt/modul原创 2021-10-05 14:49:22 · 3529 阅读 · 0 评论 -
SQL中的DDL、DML、DQL、DCL
原文链接:https://blog.csdn.net/qq_45069279/article/details/115270096数据库的核心语言就是SQL语言,那 DDL、DML、DQL、DCL 分别是什么?下面谈谈这四者的概念。一、DDL语句DDL(Data Definition Language)语句: 数据定义语言,主要是进行定义/改变表的结构、数据类型、表之间的链接等操作。常用的语句关键字有 CREATE、DROP、ALTER 等。CREATE TABLE 表名(列名1 数据类型,列名2转载 2021-10-05 10:12:37 · 287 阅读 · 0 评论 -
Hive——分桶表
分桶表应用于数据量极大的时候。分桶表的数据准备在/opt/module/data路径下创建好文件:vim stu.txt在文件内存入数据:1001,ss11002,ss21003,ss31004,ss41005,ss51006,ss61007,ss71008,ss81009,ss91010,ss101011,ss111012,ss121013,ss131014,ss141015,ss151016,ss16创建表create table stu_buck(id原创 2021-10-04 22:43:45 · 134 阅读 · 0 评论 -
Hive——分区表基本操作
创建分区表之前的数据准备:先创建好dept1.txt dept2.txt dept3.txt然后存入数据:dept1.txt10 ACCOUNTING 170020 RESEARCH 1800dept2.txt30 SALES 190040 OPERATIONS 1700dept3.txt50 TEST 200060 DEV 1900创建分区表:> create table dept_partition(> deptno int, dname strin原创 2021-09-29 21:20:07 · 918 阅读 · 0 评论 -
Hive——导出数据的几种方法
Insert 导出提前创建好一个student路径在/opt/module/hive下1、导出到本地文件系统:mkdir student然后输入:insert overwrite local directory '/opt/module/hive/student'select * from student;2、导出到HDFSinsert overwrite directory '/student'row format delimited fields terminated by原创 2021-09-23 18:59:25 · 3009 阅读 · 0 评论 -
Hive——加载数据
向表中装载数据(Load)原创 2021-09-22 17:15:13 · 479 阅读 · 0 评论 -
Hive——修改&删除表操纵
修改表名指令:HDFS中的表名也会被修改。alter table test1(原表名) rename to test8(新表名);增加/修改/替换列信息修改列名:指令:alter table change id(原列名) stu_id(新列名) string(列的类型);往表中添加列:指令:alter table test1 add columns (name string);修改列名指令:alter table test1 replace columns(stu_id st原创 2021-09-20 23:10:14 · 341 阅读 · 0 评论 -
Hive——内部表与外部表
内部表和外部表的区别:删除外部表的时候只会删除表的元数据而HDFS上的数据不会被删除。删除内部表的时候会删除表的元数据和HDFS上的数据。外部表相对来说更安全些。创建外部表的指令:create EXTERNAL table test2;(若不加EXTERNAL则默认创建的是内部表)查看当前表属于哪种表的指令:desc formatted test(查询的表名)显示:Table Type: MANAGED_TABLE(内部表)EXTERNAL_TABLE(外部表)修改当前表类型的原创 2021-09-20 22:20:30 · 157 阅读 · 0 评论 -
使用JDBC方式访问Hive
修改配置文件:hive-site.xml<!-- 指定存储元数据要连接的地址 --> <property> <name>hive.metastore.uris</name> <value>thrift://hadoop102:9083</value> </property> <!-- 指定 hiveserver2 连接的 host --><property> <name>原创 2021-09-16 08:30:11 · 513 阅读 · 0 评论