- 缘起
在DolphinDB里,由于其脚本语言表达能力不限于标准SQL,可以定义内存表变量,分布式内存表,分布式表等,传统的 `select col1,col2 from db.tb` 这类sql,脚本解析引擎会优先将 from 子句中的内容识别为内存表变量,若要读取分布式表内容,必须要使用 select col1, col2 from loadTable("dfs://db", "table") where ...这种函数方式,显式提供dfs路径来加载分布式库。对于使用惯了标准SQL的数据库用户来说,这个写法怎么看怎么别扭 :P
因为吐槽的用户太多,开发团队终于引入了Catalog的概念来解决这个问题,目标是通过设定默认的catalog,解析引擎优先在catalog内搜索库表名的方式,实现标准SQL的写法,如: selelct * from db.table where... , 不再需要用loadTable这样的方式来定位分布式库和表。
- 入门
先从文档中心查找 "Catalog"关键字,找到一篇教程【数据目录Catalog】,介绍了新引入的catalog,schema的概念,以及与原系统数据库表概念的映射关系。教程里介绍了概念,但是实操类的信息比较少。
怎么创建数据目录?
原有的数据库怎样归类到不同数据目录下?
新建的数据库怎么指定数据目录