- 博客(4)
- 收藏
- 关注
原创 大数据学习第三天
也可以称为面向专业分析人员进行数据分析,通常进行查询分析操作,一般针对某些主题的历史数据进行分析,支持管理决策。,也可以称面向用户交易的处理系统,它是针对具体业务在数据库联机的日常操作,通常进行。数据库设计是尽量避免冗余,数据仓库在设计是有意引入冗余。数据库一般存储业务数据,数据仓库存储的一般是历史数据。数据库是为捕获数据而设计,数据仓库是为分析数据而设计。数据库是面向事务的设计,数据仓库是面向主题设计的。数据库和HDFS的关系。今天的学习,收货很多!是操作型处理,叫联机。是分析型处理,叫联机。
2024-04-24 22:53:34
145
原创 Hadoop学习第二天
描述Hive数据仓库中存储的数据和表结构的信息是HadoopHive,这些元数据通常是以关系数据库的形式存储在Hive元数据仓库之中。我还学习了HDFS副本机制,在HDFS中存储数据的时候,数据会被分成很多个副本并且将它们存储在不同的节点上面来确保数据的可靠。HDFS将一个大的文件划分成固定大小的数据块,并且每个数据块都会被复制许多次且存储在不同的节点上。通过查询相关资料,我了解了Hive的主要优势是它的易用性和可扩展性,我们可以通过使用HiveQL进行快速的编写复杂的查询并且不需要学习新的编程语言。
2024-04-23 21:52:19
155
2
原创 Hadoop之分布式与集群
通过Hadoop集群,可以处理和分析大规模数据,挖掘数据中的价值和洞见,为企业和组织带来更多的商业价值和竞争优势。学习了以上内容之后,我对Hadoop的分布式和集群有了更为完整的理解和体会,对我今后的Hadoop学习有了非常大的帮助。总的来说,学习Hadoop中的YARN框架是我在大数据领域中的重要一步,通过理解YARN的原理和特性,我不仅提升了对大数据资源管理和作业调度的理解,也培养了解决复杂问题和优化资源利用的能力。通过优化集群的配置和参数,可以更好地满足不同作业的需求和优化集群的性能。
2024-04-22 21:58:00
497
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人