- 博客(11)
- 收藏
- 关注
原创 HIVE数据库(Hive内置函数)
5.1 计算日期表date_table中,开始日期与结束日期相差的月以及开始日期与当前日期相差的月。6.1 根据员工信息表employess_table中员工年龄数据,判断员工属于中年还是青年。6.2 根据员工信息表employess_table中员工薪资数据,判断员工薪资级别。7.2 去除员工信息表employess_table中员工姓名中的空格。获取员工信息表employess_table中员工薪资的整数数据。7.3 获取员工信息表employess_table中员工的姓氏。
2024-06-06 17:35:10 348
原创 Hive 视图的基本操作命令及操作
2.对零售商店数据库retail_db中表的视图管理操作。3.基于订单表、订单明细表和产品表的视图如下表。1.使用Hive Shell命令行完成操作。
2024-06-05 21:05:09 500 1
原创 Hive数据库及表操作
Hive查询即是SELECT语句用于对表中的数据进行查询按照规定的语法规则从表中选取数据WHERE条件必须是布尔表达式,用于过滤结果集常用条件表达式。
2024-06-05 20:32:06 367
原创 Hive数据库及表操作
abc’ like ‘a%’,’abc’ like ‘a__’均可返回TRUE,可使用NOT反转。A为空时返回TRUE,否则返回FALSE,可使用NOT反转。A为字符串,B为标准,如’abc’ like ‘a*’,A,B均为TRUE返回TRUE,否则返回FALSE。A或B为TRUE返回TRUE,否则返回FALSE。A为FALSE,返回TRUE,否则返回FALSE。A与B不相等返回TRUE,否则返回FALSE,比较运算符所返回的内容,符合条件返回TRUE,A与B相等返回TRUE,否则返回FALSE。
2024-06-05 20:17:04 304
原创 数据仓库技术及应用(Hive内部表与外部表)
内部表(managed table): 未被external修饰的表,也叫管理表。外部表(external table):被external修饰的表。内部表&外部表的区别:内部表:删除表会删除表的元数据(metadata)和表数据(data)。外部表:删除表会删除表的元数据(metadata),但不会删除表数据(data)。数据管理方式:数据(data)都存储在HDFS上,内部表由Hive自身管理,外部表数据由HDFS管理;
2024-05-23 17:07:18 178 1
原创 数据仓库技术及应用(库表操作)
load命令实现,将数据复制或移动到Hive表对应的位置。insert命令实现,执行MR作业将数据插入Hive表中。(1)常用命令 load、insert、update、delete、merge、explain等。执行这些操作需要开启ACID(事务)支持;Hive是数据仓库解决方案,不适合做这种操作。使用import/export实现数据导入\导出。(3)Hive更新、删除、合并数据。(3)Hive DDL其他操作。4.Hive DML操作。(4)数据导入\导出。
2024-05-23 16:24:00 378 1
原创 数据仓库技术及运用(hive操作)
create database db;alter(database|schema)db1;use db1;create table tb1;alter table tb1 rename to tb2;insert into tb2(name,id)values('张三','123'),('李四','456');alter table name add cloumns(class string);drop table tb2;drop database db1;
2024-03-28 16:09:56 273 1
原创 数据仓库及应用(hive基础)
Database:数据库,在HDFS中为hive.metastore.warehouse.dir目录下的一个文件夹。Tables:表,表由列构成,在表上可以进行过滤、映射、连接和联合操作,在HDFS中为数据库目录下的子目录。Hive表分为内部表和外部表:内部表类似于RDBMS中的表,由Hive管理 外部表指向已经存在HDFS中的数据,外部表的真实数据不被Hive管理。Partitions 分区,每个表都可以按指定的键分为多个分区,作用是为了提高查询的效率,在HDFS中是表目录的子目录。
2024-03-18 16:53:59 1581
原创 数据仓库技术及应用(虚拟机安装问题)
勾中左边的所有选项,然后点击Scan for Issues,然后点击右边的Review selected Issues…这个是清理注册表中所有未关联项目的。2.卸载c盘里面C:\Program Files (x86)\Common Files关于VMmare的文件。HKEY_CURRENT_USER\Software\VMware, Inc.,我们可以下载一个。CCleaner的主要用途是清除Windows系统内的缓存垃圾,包括那些没有使用的插件,导致以上情况的原因是因为以前的虚拟机没有删除干净。
2024-03-03 14:20:49 2079
原创 数据仓库技术及应用
目录一、数据仓库的定义二、数据仓库的优势三、数据仓库的架构四、云数据仓库的介绍五、现代数据仓库介绍数据仓库是一种面向商务智能 (BI) 活动(尤其是分析)的数据管理系统,它仅适用于查询和分析,通常涉及大量的历史数据。在实际应用中,数据仓库中的数据一般来自应用日志文件和事务应用等广泛来源。数据仓库能够集中、整合多个来源的大量数据,借助数据仓库的分析功能,企业可从数据中获得宝贵的业务洞察,改善决策。同时,随着时间推移,它还会建立一个对于数据科学家和业务分析人员极具价值的历史记录。
2024-02-29 16:31:24 135 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人