postgres-xl
有时候,最好将您所知道的内容一起使用。 对于无数的开发人员,数据库管理人员,分析师以及需要在传统的关系数据库系统中存储数据的其他人员而言, PostgreSQL是该系统。 但是随着对数据库需求的增长,构成数据库基础的软件也必须不断增长。
现代数据库需要在多个系统之间实现并发性,并且用户希望数据能够快速,轻松且无故障地进行同步。 要在PostgreSQL中做到这一点,需要教一些老手新技巧。 认识TransLattice ,这是一家专门从事分布式SQL数据库的公司,该公司最近收购了现代数据库技术的创新者StormDB。
为了对Postgres进行一些现代化的改进,TransLattice今天宣布基于从StormDB收购的技术对Postgres-XL进行开源。 Postgres-XL是一个集群的并行SQL数据库,设计用于在线事务处理(OLTP)和大数据分析。 我与TransLattice的首席执行官Frank Huerta和首席架构师Mason Sharp进行了交谈,以了解有关Postgres-XL及其对开源社区的意义的更多信息。
告诉我一些您对Postgres-XL感到兴奋的地方以及它的发展过程。
对于Postgres-XL,我们所做的是基于StormDB,并且基于Postgres。 Postgres具有用于数据库并发的多版本并发控制模型。 为了使数据库在系统集群之间保持一致,该管理已从核心数据库中撤出,并增加了一个组件。 这样,在整个集群范围内,您始终可以获得一致的数据视图,并且这样做还可以实现OLTP写入可伸缩性,因此不仅可以读取,还可以在多个节点之间扩展写入。 此外,在数据节点级别,我们对它们彼此交互的位置进行了一些更改。 我们允许进行大规模并行处理(MPP)处理,查询可以在其中并行化。 因此,我们可以使用集群中的所有资源来更快地处理查询。
Postgres是一个很棒的通用数据库。 还有其他专门从事写事务的数据库,或者使用Hadoop处理大量数据的人们。 Postgres-XL具有强大的通用功能并对其进行了扩展,因此它也可以在混合工作负载环境中处理各种工作负载。
哪些人可能会对使用Postgres-XL感兴趣的应用程序或用例有哪些样本类型?
正如我们之前所强调的那样,大数据分析具有并行性,例如金融服务或获得大量流量数据并希望分析该数据的安全公司。 例如,对于OLTP写密集型工作负载,我们正在与一家在线广告公司进行交流,他们需要跟踪很多印象和点击次数。 在混合的工作负载中,您可能会进行不同类型的活动。
您还可以使用它来合并来自各种来源的数据,例如在运营数据存储中。 具有Postgres的传统,实际上支持JSON数据类型,因此人们使用NoSQL数据库是一件很平常的事情。 Postgres实际上具有内置功能,因此我们能够利用它。 我们可以在不牺牲一致性的情况下为您提供跨多个服务器的键值存储。
同样利用Postgres的遗产,还有PostGIS ,它增加了强大的地理空间功能。 您也可以直接插入; 如果您有大量GPS数据,大量位置数据,则处理所有这些数据可能需要大量计算。 现在,您可以利用群集中的多个服务器更快地处理该数据。
另外,我们的想法是,如果您拥有传统的硬件资源,并且使用不同的应用程序,则它们的工作量可能在不同的时间发生变化,并且可能是突发性的,因此您可以拥有具有多个数据库类型的机器集群。这些服务器之间。 同时,我们希望使其更加安全,因此Postgres开箱即用,您可以了解其他数据库和用户的命名空间是什么。 因此,我们将其锁定为更好地支持多租户,以及添加其他统计信息并跟踪所有数据库中发生的情况。 这也使其可用作托管数据库解决方案。
您为什么决定开源这项技术?
我们认为回馈社区很重要,因为社区为我们在TransLattice所做的工作提供了动力。 无论如何,我们将把其中一些技术带入我们的产品中。 我们正在吸引合作伙伴为这项技术提供服务,并且我们还将提供这些服务。
希望这将成为一个社区项目,并希望您从组织外部的用户那里获得提交吗?
是的,一点没错! 已经有两家一流的Postgres咨询公司表示将为这个项目做出贡献。 我们还与较大的Postgres社区的成员进行了一些对话,并且似乎为此做出了一些贡献。 我们扎根于Postgres,因此回馈代码已经是我们正在做的事情。
翻译自: https://opensource.com/business/14/5/PostGres-XL-large-scale-database
postgres-xl