Go语言进阶（二） -- 编译原理基础、规则引擎设计与实现词法分析语法分析语法数上下文无关语法巴科斯范式

异已

已于 2023-03-03 10:44:31 修改

阅读量748

点赞数

分类专栏： Go 文章标签： golang go

于 2023-03-02 16:26:10 首次发布

本文链接：https://blog.csdn.net/yllblog/article/details/129303022

版权

Go 专栏收录该内容

7 篇文章

订阅专栏

文章介绍了规则引擎的概念，它用于分离业务决策和应用程序代码，简化积分计算等业务规则配置。规则引擎包含数据输入、规则理解和执行等部分，常用于风控、运营策略和数据分析场景。文章深入讨论了编译原理，包括词法分析（有限自动机）、语法分析（上下文无关语法、抽象语法树）和类型检查，并展示了设计规则引擎的目标和步骤，包括词法状态机和巴科斯范式。最后，提到了一个简易版规则引擎的实现。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Go 规则引擎设计与实现

1.认识规则引擎

1.1 背景

在这里插入图片描述

1.2 目标

直接把计算规则输入进去，直接输出积分，规则简单容易配置、可扩展

在这里插入图片描述

1.3 规则引擎定义：

规则引擎是一种嵌入在应用程序中的组件，实现了将业务决策从应用程序代码中分离出来，并使用预定义的语义模块编写业务决策。接受数据输入，解释业务规则，并根据业务规则做出业务决策。

在这里插入图片描述

1.4 组成部分：

数据输入

支持接受使用预定义的语义编写的规则作为策略集。比如“price > 500”
接受业务的数据作为执行过程中的参数，比如价格、标签等

规则理解

能够按照预先定义的词法、语法、优先级、运算符等正确理解业务规则所表达的语义。

规则执行

根据执行时输入的参数对策略集中的规则进行正确的解释和执行。同时对规则执行过程中的数据类型进行检查，确保执行结果正确。

在这里插入图片描述

1.5 应用场景

风控对抗
与黑灰产的对抗过程中，策略研发和产品需要能够根据黑灰产特征进行快速识别和对抗。规则引擎作为风控系统的核心，使产研人员能够不断的调整和优化对抗策略，以实现最好的风控识别效果。

活动策略运营
业务活动的运营需要及时根据用户效果反馈进行运营策略的优化和调整。引入规则引擎后，可以将服务代码与业务运营逻辑解耦，提高运营策略的迭代效率。方便新玩法的探索和效果验证

数据分析和清洗

在数据分析系统中使用规则引擎可以便捷的实现对数据进行整理、清洗和转换。数据分析师可以根据不同的需求来自定义数据处理的规则，方便快捷的产出所需要的数据。

2.编译原理基本概念

2.1 规则引擎编译流程：

在这里插入图片描述

2.2 词法分析

词法分析就是把源代码字符串转换为词法单元（Token）的过程。

如下，以空格分割的词法分析：
在这里插入图片描述

引擎如何识别 Token ? – 有限自动机(Finite-State Automaton)

有限自动机是一个状态机，它的状态数量是有限的，该状态机在任何一个状态，基于输入的字符，都能做一个确定的状态转换。

2.3 语法分析 Syntax Analysis

语法分析就是在词法分析的基础上，识别表达式的语法结构的过程。

在这里插入图片描述

2.3.1 抽象语法树

表达式的语法结构可以用树来表示，其每个节点（子树）是一个语法单元，这个单元的构成规则就叫"语法"。每个节点还可以有下级节点。

在这里插入图片描述

上下文无关语法

在这里插入图片描述

编程语言为什么不用人类的语言（自然语言），而是用上下文无关的文法呢？因为

便于设计编译器。客观上技术目前无法实现，如果使用了上下文相关文法，那就是真正实现了人工智能，NLP领域将会有重大突破。
便于代码开发维护。如果开发出来的代码像高考的语文阅读理解一样，每个人都有不同的理解，那么，到底哪个才是作者真正想要表达的？如果人类都确定不了含义，那计算机同样也确定不了，最终结果就是错误执行或无法执行。
汇编语言/机器语言是上下文无关的。CPU执行指令时，读到哪条执行哪条。如果CPU需要考虑上下文，来决定一个语句到底要做什么，那么CPU执行一条语句会比现在慢千倍万倍。考虑上下文的事情，完全可以用户在编程的时候用算法实现。既然机器语言是上下文无关的，那高级语言也基本上是上下文无关的，可能有某些个别语法为了方便使用，设计成了上下文相关的，比如脚本语言的弱类型。在便于使用的同时，增加了解析器的复杂度。

巴科斯范式

BNF是描述上下文无关理论的一种具体方法，通过BNF可以实现上下文无关文法的具体化、公式化、科学化，是实现代码解析的必要条件。

<expr> ::= <expr> + <term>
         | <expr> - <term>
         | <term>

<term> ::= <term> * <factor>
         | <term> / <factor>
         | <factor>

<factor> ::= ( <expr> )
           | Num

如下演示递归下降算法流程：

1. 一层一层往下推，找出当前符号属于什么类型表达式；

2. 下层表达式同时也是上层表达式例如：pri 也是 cmp 表达式。
在这里插入图片描述

类型检查
- 类型综合法：
  - 根据子表达式的类型构造出父表达式的类型。例如表达式 A + B是根据A和B的类型定义的。
- 检查时机：
  - 类型检查可以发生在表达式的编译阶段，即在构造语法树的阶段；也可以发生在执行时的阶段。

3.设计规则引擎

3.1 设计目标：

设计一个规则引擎，支持特定的词法、运算符、数据类型和优先级。并且支持基于以上预定义语法的规则表达式的编译和执行。

3.2 词法分析：

词法（合法 Token）

参数 : 由字母数字下划线组成 eg:_ab2、user_name

布尔值：true、false
字符串：“abcd”、'abcd’、`abcd

十进制int：1234

十进制float：123.5

预定义运算符：±
运算符

一元运算符：+ -
二元运算符：+ - * / % > < >= <= == !

逻辑操作符：&& || !

括号：()
数据类型

字符串

布尔值

十进制int

十进制float
优先级

在这里插入图片描述

词法状态机

在这里插入图片描述

3.3 语法分析

巴科斯范式

在这里插入图片描述

说明： expr - 表达式； log - 逻辑运算符；cmp - 比较表达式；add - 加法式；mul - 乘法式；pri - 基础表达式

优先级的表达

type precedence struct {
	validSymbols []Symbol // 当前优先级支持的运算符类型 
	nextPrecedence *precedence // 更高优先级的 
	planner planner // 当前优先级的处理函数 
}

语法树结构

一元运算符：左子树为空，右子树为右操作树

二元运算符：左子树为左操作数，右子树为右操作数

括号：左子树为空，右子树为内部表达式的 AST
语法树的执行和类型检查
- 语法树执行
  
  预先定义好每种操作符的执行逻辑。对抽象语法树进行后续遍历执行，即:
  
  先执行左子树，得到左节点的值;再执行右子树，得到有节点的值;
  
  最后根据根节点的操作符执行得到根节点的值。
- 类型检查
  
  检查时机: 执行时检查
  
  检查方法: 在一个节点的左右子节点执行完成后，分别校验左右子节点的类型是否符合对应操作符的类型检查预设规则。
  
  '>’ 符号要求左右子节点的值都存在且为 int或float
  
  '!’ 符号要求左节点为空且右节点的值为 bool
4. 实现规则引擎

字节大佬写的简易版的规则引擎，后续再出个代码解析文档。
规则引擎