数据虚拟化及其用例介绍

最新推荐文章于 2024-08-16 12:04:31 发布

Tybyqi

最新推荐文章于 2024-08-16 12:04:31 发布

阅读量2k

点赞数

分类专栏：大数据

大数据专栏收录该内容

74 篇文章 2 订阅

订阅专栏

数据虚拟化是解决几个问题的解决方案。这种解决方案正在蓬勃发展，同比增长强劲。但我们首先从定义开始。

Kezako？

数据虚拟化是在数据源和数据使用者之间插入数据访问层以促进访问的过程。在实践中，我们有一种SQL请求程序作为工具，它能够查询非常异构的数据源，从传统的SQL数据库到文本或PDF文件，或像Kafka这样的流式源。简而言之，您拥有数据，可以查询数据，并在此数据之间生成连接。实际上，您可以提供统一且完整的数据视图，即使它在多个系统之间“爆炸”。最重要的是，您拥有缓存和查询优化器，可以在性能方面最小化对源系统的影响。当然，您有一个数据目录，可帮助您找到IT基础架构中所有数据的方式。由此我们可以推导出两个主要用例。

集成用例

这是不可避免地想到的第一个用例。一家有点错过“数字”转变的大型银行正在努力为其客户提供一个包含所有相关数据的门户网站。旧的异构甚至是异国情调的系统，无法同时支持成千上万的客户，这是该银行的基础。使用数据虚拟化解决方案，数据暴露的速度与您必须使用Hibernate在Java中执行简单的DAO类一样快。您可以添加连接，使用数据目录搜索数据，编写请求，在API中公开它们，以及拥有公开数据所需的所有资产。这就是全部，就这么简单。制作API，如果您知道在何处查找数据，则需要5分钟。当然，您不会实现插入和更新，但请记住，读数占客户端门户上80％的请求，并且CQRS模式不存在！您将通过API实现插入和更新，这肯定会调用现有的事务！

这样可以节省大量时间，因为不需要通过ETL或Change Data Capture输出数据，这需要您了解所有数据。