- 博客(4)
- 收藏
- 关注
原创 (第四天)
数据仓库实战案例综合运用:该部分介绍了数据仓库实战中的重要应用场景和解决方案,包括黑马畅聊聊天平台、Hive 数据仓库等方面。数据仓库实战指标计算:该部分介绍了数据仓库实战中的重要指标计算方法和技巧,包括如何计算指标、如何处理指标等方面。数仓基础概念:该部分介绍了数据仓库的基础概念和架构,包括数据源、数据仓库、数据应用等。数据清洗:该部分介绍了数据清洗的重要性和方法,包括数据探查、数据清洗和数据准备等方面。该部分介绍了一些实际的数据仓库案例,包括源数据、数据仓库、数据应用等方面的案例。
2024-04-25 20:54:07
125
3
原创 数据库的操作(第三天)
(1)创建内部表: create table [if not exists] 内部表名( 字段名 字段类型 , ... )...;外部表转内部表 alter table stu set tblproperties('EXTERNAL'='FALSE');内部表转外部表 alter table stu set tblproperties('EXTERNAL'='TRUE');要注意:('EXTERNAL'='FALSE') 或 ('EXTERNAL'='TRUE')为固定写法,区分大小写!
2024-04-24 21:02:02
621
原创 hdfs的简单介绍(第二天)
Hive是一个构建在Hadoop上的数据仓库工具,能够将文件转化为表结构,同时简化大数据处理的过程。Hive通过提供类SQL的查询语言(HQL),能够方便地对存储在Hadoop中的大规模数据进行查询、汇总和分析。文件上传HDFS 的时候,Client 将文件切分成 一个一个的Block,然后进行存储。它将每个文件存储成一系列的数据块,这个数据块被称为block,除了最后一个,所有的数据块都是同样大小的。管理 HDFS 元数据(文件路径,文件的大小,文件的名字,文件权限,文件的block切片信息…
2024-04-23 21:11:13
599
原创 Hadoop的简单了解(第一天)
Hadoop的框架设计使得它在大数据存储和处理方面具有显著优势。同时,Hadoop的MapReduce框架使得分布式计算变得简单和高效,许多企业使用Hadoop来处理和分析数据,以便发现数据中的模式和趋势,做出更好的业务决策。总的来说,Hadoop是一个功能强大的分布式系统基础架构,它利用集群的威力进行高速运算和存储,并提供了丰富的工具和库来支持大数据处理和分析。除此之外,Hadoop还提供了丰富的生态系统,包括各种数据处理和分析工具、机器学习库等,使得用户可以更加灵活和高效地处理和分析大数据。
2024-04-22 21:25:10
291
1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人