我们的随时都受到来自各方的威胁,数据泄露、数据丢失这些问题一直困扰着我们,我们却无能为力。在这个信息裸奔的年代,我们别无选择,随着技术的进步与成熟我们逐渐找到了对抗的武器,今天就来谈一谈“分布式数据湖”这个概念。
数据湖的概念,来自大数据和机器学习业务。我们日常一定听过数据库,数据库的形式可大可小,是非常独立的数据存储单位,每个数据存储位置都是一个数据库,当数据库之间被打通,形成一个大数据交互结构,就可以理解为数据湖的形象。数据湖是一个安全的集中式辅助存储库,它以数据原始形式和可用于分析的形式存储所有数据。
利用数据湖,可以分解数据孤岛并组合不同类型进行分析,获得分析结果指导更好的业务决策。数据湖的关键问题在于如何解决加密和数据访问授权问题,这和我们现在所说的去中心化数据结构不谋而合。
去中心化数据结构的出现和产生让我们看到了另一种数据存储的可能。
为什么我们需要“分布式数据湖”
最新推荐文章于 2024-04-22 13:30:07 发布