m0_75102335-CSDN博客

原创通过BI实现数据可视化

通过“可视化”的方式，复杂的数据通过图形化的手段进行有效表达，准确高效、简洁全面地传递某种信息，甚至我们帮助发现某种规律和特征，挖掘数据背后的价值。数据拿到手之后，我们要对数据进行加工，进行脏数据清洗和一些数据指标的计算，可能要对数据进行过滤、分组汇总、排序、合并等操作。然而，传统的报表制作过程往往需要手动操作，不仅耗时还容易出错。在FineBI中，进行数据可视化分析的过程比较简单，简单拖拽就可以生成可视化图表，非常适合业务人员进行自助的探索式分析，找到最适合的分析的数据指标，充分挖掘数据背后的价值。

2024-04-26 00:01:53 712 2

原创实习第三天

数据库是为捕获数据而设计，数据仓库是为分析数据而设计数据库设计是尽量避免冗余，一般针对某一业务应用进行设计，比如一张简单的User表，记录用户名、密码等简单数据即可，符合业务应用，但是不符合分析。数据库中的数据按一定的数学模型组织、描述和存储，具有较小的冗余，较高的数据独立性和易扩展性，并可为各种用户共享。为临时存储层，是接口数据的临时存储区域，为后一步的数据处理做准备。数据仓库层（DW）：也称为细节层，DW层的数据应该是一致的、准确的、干净的数据，即对源系统数据进行了清洗（去除了杂质）后的数据。

2024-04-24 23:03:42 507

原创认知实习第二天

Hive是一个基于Hadoop的数据仓库工具，它可以将类SQL查询转换为MapReduce并运行在Hadoop集群上。使用Hive可以将数据保存在Hadoop HDFS中，在执行查询任务时，Hive会将SQL语句翻译成MapReduce作业，然后交由Hadoop进行处理。MapReduce是一种分布式计算模型，它可以将任务分解为多个小任务，通过节点间协作并进行计算，以实现高效的处理能力。在Hadoop集群中，数据被分割为多个块，每个块都会被存储在不同的节点上，然后通过MapReduce模型进行分布式计算。

2024-04-23 23:13:50 420 4

原创【无标题】初识Hadoop以及集群分布

狭义上：Hadoop是一个框架平台。为了让厨师专心炒菜，把菜做到极致，又请了个配菜师负责切菜、备菜、备料，厨师和配菜师的关系是分布式。NameNode是主节点，主要用于管理集群中的各种数据，DataNode集群中的从节点，主要用于存储集群中的各种数据，SecondaryNameNode用于Hadoop当中数据信息的辅助管理。分布式:分布式指的是将一个系统的不同组件部署在不同的服务器上，分布式系统的设计目的是提高系统的可靠性和效率。分布式主要是分解任务，多个人一起做不同的事，而集群是多个人一起做相同的事。

2024-04-22 23:13:27 265 2

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 通过BI实现数据可视化

原创 实习第三天

原创 认知实习第二天

原创 【无标题】初识Hadoop以及集群分布

空空如也

空空如也

原创通过BI实现数据可视化

原创实习第三天

原创认知实习第二天

原创【无标题】初识Hadoop以及集群分布