自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 通过BI实现数据可视化

通过“可视化”的方式,复杂的数据通过图形化的手段进行有效表达,准确高效、简洁全面地传递某种信息,甚至我们帮助发现某种规律和特征,挖掘数据背后的价值。数据拿到手之后,我们要对数据进行加工,进行脏数据清洗和一些数据指标的计算,可能要对数据进行过滤、分组汇总、排序、合并等操作。然而,传统的报表制作过程往往需要手动操作,不仅耗时还容易出错。在FineBI中,进行数据可视化分析的过程比较简单,简单拖拽就可以生成可视化图表,非常适合业务人员进行自助的探索式分析,找到最适合的分析的数据指标,充分挖掘数据背后的价值。

2024-04-26 00:01:53 712 2

原创 实习第三天

数据库是为捕获数据而设计,数据仓库是为分析数据而设计数据库设计是尽量避免冗余,一般针对某一业务应用进行设计,比如一张简单的User表,记录用户名、密码等简单数据即可,符合业务应用,但是不符合分析。数据库中的数据按一定的数学模型组织、描述和存储,具有较小的冗余,较高的数据独立性和易扩展性,并可为各种用户共享。为临时存储层,是接口数据的临时存储区域,为后一步的数据处理做准备。数据仓库层(DW):也称为细节层,DW层的数据应该是一致的、准确的、干净的数据,即对源系统数据进行了清洗(去除了杂质)后的数据。

2024-04-24 23:03:42 507

原创 认知实习第二天

Hive是一个基于Hadoop的数据仓库工具,它可以将类SQL查询转换为MapReduce并运行在Hadoop集群上。使用Hive可以将数据保存在Hadoop HDFS中,在执行查询任务时,Hive会将SQL语句翻译成MapReduce作业,然后交由Hadoop进行处理。MapReduce是一种分布式计算模型,它可以将任务分解为多个小任务,通过节点间协作并进行计算,以实现高效的处理能力。在Hadoop集群中,数据被分割为多个块,每个块都会被存储在不同的节点上,然后通过MapReduce模型进行分布式计算。

2024-04-23 23:13:50 420 4

原创 【无标题】初识Hadoop以及集群分布

狭义上:Hadoop是一个框架平台。为了让厨师专心炒菜,把菜做到极致,又请了个配菜师负责切菜、备菜、备料,厨师和配菜师的关系是分布式。NameNode是主节点,主要用于管理集群中的各种数据,DataNode集群中的从节点,主要用于存储集群中的各种数据,SecondaryNameNode用于Hadoop当中数据信息的辅助管理。分布式:分布式指的是将一个系统的不同组件部署在不同的服务器上,分布式系统的设计目的是提高系统的可靠性和效率。分布式主要是分解任务,多个人一起做不同的事,而集群是多个人一起做相同的事。

2024-04-22 23:13:27 265 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除