1 Trino 简介
Trino[1] 是一种支持使用 SQL 访问任意数据源的 SQL 查询引擎,其能够提供更加灵活与高效的查询服务。本章节将简单介绍 Trino 的基本功能与使用场景。
1.1 大数据的问题
在如今的信息化时代,数据无处不在。无论是个人还是企业,对于数据的理解与洞察都是取得成功的关键。当前,对于数据的存储机制存在极强的多样性,例如关系型数据库、NoSQL 数据库、文档数据库、键值存储、对象存储,如下图所示。现代的信息系统通常需要将多种存储机制进行结合才能满足实际的使用需求。
概括来说,上述这些不同的数据存储系统在数据查询方面存在着如下问题:
- 不同的系统使用不同的查询语言与分析工具,缺乏统一的标准工具(不同系统的 SQL 语法也存在差异)
- 不同系统的数据分布在不同的孤岛上,跨数据库的联邦查询支持还并不完善