在一些系统中需要对SQL查询语句进行解析,并最终根据业务需求将其转换处理将其转换为真实的SQL语句,这一过程我把它简称为:逻辑SQL-物理SQL的转换。在这一过程其中的关键技术是逻辑SQL语法分析,语法分析实现采用例如树型语法分析模型等方式实现,它是以二叉树方式,针对SQL中的关键字(例如:Select,From,Where等)进行判断并作为节点形成树型基本结构,再以二叉树方式加载查询数据(例如:查询字段,表名,条件等),最后形成二叉树结构模型,为后续的逻辑模型转换为物理模型提供词元数据,最后借助元数据系统辅助实现SQL语句转换工作。
逻辑SQL语句的解析(LSQL Parse)在技术上主要依托Antlr产品来实现。而ANTLR是语言识别的一种工具。它可以接受语法规则描述,并能根据语法规则自动产生识别这些符合语法规则的语句的程序。它作为翻译程序的一部分,可以允许使用简单的操作符和动作来表达你的语法规则,从而帮助ANTLR轻松简单地创建抽象语法树(AST)和产生最终输出信息。ANTLR能够知道怎样去生成识别程序,语言包括Java,C++,C#和Python等。
逻辑SQL语句的解析(LSQL Parse)在技术上主要依托Antlr产品来实现。而ANTLR是语言识别的一种工具。它可以接受语法规则描述,并能根据语法规则自动产生识别这些符合语法规则的语句的程序。它作为翻译程序的一部分,可以允许使用简单的操作符和动作来表达你的语法规则,从而帮助ANTLR轻松简单地创建抽象语法树(AST)和产生最终输出信息。ANTLR能够知道怎样去生成识别程序,语言包括Java,C++,C#和Python等。
逻辑SQL脚本自动解析功能借助Antlr来实现对逻辑SQL脚本的词法、语法和语义分析,然后将逻辑SQL语句根据规则自动分拆为不同词元,并生成AST(抽象语法树)对象结构进行存储,后续的逻辑SQL检查与转换工作将主要围绕解析后生成的AST对象展开。具体的逻辑SQL完整解析过程如下图所示: