有限状态机,也称为 FSM(Finite State Machine) ,其在任意时刻都处于有限状态集合中的某一状态。当其获得一个输入字符 时,将从 当前状态 转换到 另一个状态 ,或者仍然保持在当前状态 。任何一个FSM都可以用状态转换图来描述,图中的节点表示FSM中的一个状态,有向加权边表示输入字符时状态的变化。如果图中不存在与当前状态与输入字符对应的有向边,则FSM将进入“消亡状态 (Doom State) ”,此后FSM将一直保持“消亡状态”。状态转换图中还有两个特殊状态:状态1称为 “起始状态” ,表示FSM的初始状态。状态6称为 “结束状态” ,表示成功识别了所输入的字符序列。
在启动一个FSM时,首先必须将FSM置于“起始状态”,然后输入一系列字符,最终,FSM会到达“结束状态”或者“消亡状态”。
说明:
在通常的FSM模型中,一般还存在一个“接受状态”,并且FSM可以从“接受状态”转换到另一个状态,只有在识别最后一个字符后,才会根据最终状态来决定是否接受所输入的字符串。此外,也可以将“其实状态”也作为接受状态,因此空的输入序列也是可以接受的。
FSM的实现
程序设计思路大致如下:
- 使用状态转换图描述FSM
- 状态转换图中的结点对应不同的状态对象
- 每个状态对象通过一个输入字符转换到另一个状态上,或者保持原状态不变。
通过输入字符从一个状态切换到另一个状态的过程,我们称之为一个 映射 。在计算机程序设计中, 我们可以有两种表示映射的方法:
- 通过算法表示,即“可执行代码(Executable Code)”方式
- 通过一张映射表,即“被动数据(Passive Data)”方式
如下详细介绍这两种实现方式:
- 通过Executable Code 实现映射的FSM :
这种方式主要是通过条件分支来处理不同的字符,如if或者switch语句块,如
- State* State1::Transition(char c)
- {
- switch(c)
- {
- case 'A':
- return &s2;
- case 'B':
- return &s3;
- case 'C':
- return &s4;
- case 'D':
- return &s5;
- case '\0':
- return NULL;
- default:
- return NULL;
- }
- }
- // fsm_with_executable_code.h
- #ifndef FSM_WITH_EXECUTABLE_CODE_H
- #define FSM_WITH_EXECUTABLE_CODE_H
- #include <string.h>
- class State
- {
- public:
- virtual State* Transition(char c) = 0;
- };
- class Fsm
- {
- public:
- Fsm();
- void Reset(); // move to start state
- void Advance(char c); // advance one transition
- int EndState();
- int DoomState();
- private:
- State* p_current; // &s1, &s2, ..., &s6; NULL ==> doom
- };
- class State1 : public State
- {
- public:
- State* Transition(char c);
- };
- class State2 : public State
- {
- public:
- State* Transition(char c);
- };
- class State3 : public State
- {
- public:
- State* Transition(char c);
- };
- class State4 : public State
- {
- public:
- State* Transition(char c);
- };
- class State5 : public State
- {
- public:
- State* Transition(char c);
- };
- class State6 : public State
- {
- public:
- State* Transition(char c);
- };
- #endif // FSM_WITH_EXECUTABLE_CODE_H
- // fsm_with_executable_code.cc
- #include "fsm_with_executable_code.h"
- State1 s1;
- State2 s2;
- State3 s3;
- State4 s4;
- State5 s5;
- State6 s6;
- Fsm::Fsm()
- {
- p_current = NULL;
- }
- void Fsm::Reset()
- {
- p_current = &s1;
- }
- void Fsm::Advance(char c)
- {
- if (p_current != NULL)
- p_current = p_current->Transition(c);
- }
- int Fsm::EndState()
- {
- return p_current == &s6;
- }
- int Fsm::DoomState()
- {
- return p_current == NULL;
- }
- State* State1::Transition(char c)
- {
- switch(c)
- {
- case 'A':
- return &s2;
- case 'B':
- return &s3;
- case 'C':
- return &s4;
- case 'D':
- return &s5;
- case '\0':
- return NULL;
- default:
- return NULL;
- }
- }
- State* State2::Transition(char c)
- {
- switch(c)
- {
- case 'E':
- return &s2;
- case 'I':
- return &s6;
- case '\0':
- return NULL;
- default:
- return NULL;
- }
- }
- State* State3::Transition(char c)
- {
- switch(c)
- {
- case 'F':
- return &s3;
- case 'M':
- return &s4;
- case 'J':
- return &s6;
- case '\0':
- return NULL;
- default:
- return NULL;
- }
- }
- State* State4::Transition(char c)
- {
- switch(c)
- {
- case 'G':
- return &s4;
- case 'K':
- return &s6;
- case '\0':
- return NULL;
- default:
- return NULL;
- }
- }
- State* State5::Transition(char c)
- {
- switch(c)
- {
- case 'O':
- return &s2;
- case 'H':
- return &s5;
- case 'L':
- return &s6;
- case 'N':
- return &s4;
- case '\0':
- return NULL;
- default:
- return NULL;
- }
- }
- State* State6::Transition(char c)
- {
- return NULL;
- }
- // test_with_executable_code.cc
- #include "fsm_with_executable_code.h"
- #include "stdio.h" // printf, scanf
- #include "stdlib.h" // system
- void test_fsm()
- {
- char input_string[80];
- printf("Enter input expression: ");
- scanf("%s", input_string);
- Fsm fsm;
- fsm.Reset();
- int index = 0;
- fsm.Advance(input_string[index++]);
- while (!fsm.EndState() && !fsm.DoomState())
- fsm.Advance(input_string[index++]);
- if (fsm.EndState())
- printf("\nValid input expression");
- else
- printf("\nInvalid input expression");
- }
- int main()
- {
- test_fsm();
- system("pause");
- }
- 通过Passive Data 实现映射的FSM :
在如上的switch分支中,其使用类型大致相同,因此,我们可以考虑将相似的信息保存到一张表中,这样就可以在程序中避免很多函数调用。在每个状态中都使用一张转换表来表示映射关系,转换表的索引使用输入字符来表示。此外,由于通过转换表就可以描述不同状态之间的变化,那么就没有必要将每种状态定义为一个类了,即不需要多余的继承和虚函数了,仅使用一个State即可。
- #include <limits.h>
- class State
- {
- public:
- State();
- State* transition[range];
- };
- 对于任意一个状态state和输入字符c,后续状态都可以通过state.transition[c]来确定。
- 类Fsm中的成员state包含6个状态,为了对应方便,我们将结束状态放在state[0]中,每个状态都使用一个三元组 { 当前状态,输入字符,下一个状态 } 来表示:
- struct TransGraph // use triple to describe map
- {
- int current_state;
- char input_char;
- int next_state;
- };
- // fsm_with_passive_data.h
- #ifndef FSM_WITH_PASSIVE_DATA_H
- #define FSM_WITH_PASSIVE_DATA_H
- #include <string.h>
- #include <limits.h> // CHAR_MAX
- const int range = CHAR_MAX + 1;
- class State
- {
- public:
- State();
- State* transition[range];
- };
- struct TransGraph // use triple to describe map
- {
- int current_state;
- char input_char;
- int next_state;
- };
- class Fsm
- {
- public:
- Fsm();
- void Reset(); // move to start state
- void Advance(char c); // advance one transition
- int EndState();
- int DoomState();
- private:
- State* p_current; // &s1, &s2, ..., &s6; NULL ==> doom
- State state[6]; // 6 states, state[0] is end state
- };
- #endif // FSM_WITH_PASSIVE_DATA_H
- // fsm_with_passive_data.cc
- #include "fsm_with_passive_data.h"
- State::State()
- {
- for (int i = 0; i < range; ++i)
- transition[i] = NULL;
- }
- Fsm::Fsm()
- {
- static TransGraph graph[] =
- {
- {1, 'A', 2}, {1, 'B', 3}, {1, 'C', 4}, {1, 'D', 5},
- {2, 'E', 2}, {2, 'I', 0},
- {3, 'F', 3}, {3, 'J', 0}, {3, 'M', 4},
- {4, 'G', 4}, {4, 'K', 0},
- {5, 'H', 5}, {5, 'L', 0}, {5, 'O', 2}, {5, 'N', 4},
- {0, 0, 0}
- };
- for (TransGraph* p_tg = graph; p_tg->current_state != 0; ++p_tg)
- state[p_tg->current_state].transition[p_tg->input_char] = &state[p_tg->next_state];
- p_current = NULL;
- }
- void Fsm::Reset()
- {
- p_current = &state[1];
- }
- void Fsm::Advance(char c)
- {
- if (p_current != NULL)
- p_current = p_current->transition[c];
- }
- int Fsm::EndState()
- {
- return p_current == &state[0];
- }
- int Fsm::DoomState()
- {
- return p_current == NULL;
- }
- // test_with_passive_data.cc
- #include "fsm_with_passive_data.h"
- #include "stdio.h" // printf, scanf
- #include "stdlib.h" // system
- void test_fsm()
- {
- char input_string[80];
- printf("Enter input expression: ");
- scanf("%s", input_string);
- Fsm fsm;
- fsm.Reset();
- int index = 0;
- fsm.Advance(input_string[index++]);
- while (!fsm.EndState() && !fsm.DoomState())
- fsm.Advance(input_string[index++]);
- if (fsm.EndState())
- printf("\nValid input expression");
- else
- printf("\nInvalid input expression");
- }
- int main()
- {
- test_fsm();
- system("pause");
- }
通用FSM的设计
如果类Fsm可以表示任意类型的FSM,那么就更符合程序设计的要求了。在构造函数中执行的具体配置应该被泛化为一种机制,我们通过这种机制来建立任意的FSM。在Fsm的构造函数中,应该将转换表作为一个参数传入,而非包含具体的转换表,如此,则不需要将转换表的大小硬编码到Fsm中了。因此,在构造函数中必须动态地创建这个存放转换表的内存空间,在析构函数中记着销毁这块内存。
- class Fsm
- {
- public:
- Fsm(TransGraph* p_tg);
- virtual ~Fsm();
- void Reset();
- void Advance(char c);
- int EndState();
- int DoomState();
- private:
- State* p_current;
- State* p_state;
- };
- Fsm::Fsm(TransGraph* p_tg)
- {
- int max_state = 0; // size for dynamically allocated graph
- for (TransGraph* p_temp = p_tg; p_temp->current_state != 0; ++p_temp)
- {
- if (p_temp->current_state > max_state)
- max_state = p_temp->current_state;
- if (p_temp->next_state > max_state)
- max_state = p_temp->next_state;
- }
- p_state = new State[max_state + 1];
- for (TransGraph* p_temp = p_tg; p_temp->current_state != 0; ++p_temp)
- p_state[p_temp->current_state].transition[p_temp->input_char] = &p_state[p_temp->next_state];
- p_current = NULL;
- }
- Fsm::~Fsm()
- {
- delete []p_state;
- }
- // fsm_with_generalization.h
- #ifndef FSM_WITH_GENERALIZATION_H
- #define FSM_WITH_GENERALIZATION_H
- #include <string.h>
- #include <limits.h> // CHAR_MAX
- const int range = CHAR_MAX + 1;
- class State
- {
- public:
- State();
- State* transition[range];
- };
- struct TransGraph
- {
- int current_state;
- char input_char;
- int next_state;
- };
- class Fsm
- {
- public:
- Fsm(TransGraph* p_tg);
- virtual ~Fsm();
- void Reset();
- void Advance(char c);
- int EndState();
- int DoomState();
- private:
- State* p_current;
- State* p_state;
- };
- #endif // FSM_WITH_GENERALIZATION_H
- // fsm_with_generalization.cc
- #include "fsm_with_generalization.h"
- State::State()
- {
- for (int i = 0; i < range; ++i)
- transition[i] = NULL;
- }
- Fsm::Fsm(TransGraph* p_tg)
- {
- int max_state = 0; // size for dynamically allocated graph
- for (TransGraph* p_temp = p_tg; p_temp->current_state != 0; ++p_temp)
- {
- if (p_temp->current_state > max_state)
- max_state = p_temp->current_state;
- if (p_temp->next_state > max_state)
- max_state = p_temp->next_state;
- }
- p_state = new State[max_state + 1];
- for (TransGraph* p_temp = p_tg; p_temp->current_state != 0; ++p_temp)
- p_state[p_temp->current_state].transition[p_temp->input_char] = &p_state[p_temp->next_state];
- p_current = NULL;
- }
- Fsm::~Fsm()
- {
- delete []p_state;
- }
- void Fsm::Reset()
- {
- p_current = &p_state[1];
- }
- void Fsm::Advance(char c)
- {
- if (p_current != NULL)
- p_current = p_current->transition[c];
- }
- int Fsm::EndState()
- {
- return p_current == &p_state[0];
- }
- int Fsm::DoomState()
- {
- return p_current == NULL;
- }
- // test_with_generalization.cc
- #include "fsm_with_generalization.h"
- #include "stdio.h" // printf, scanf
- #include "stdlib.h" // system
- void test_fsm()
- {
- char input_string[80];
- printf("Enter input expression: ");
- scanf("%s", input_string);
- TransGraph graph[] =
- {
- {1, 'A', 2}, {1, 'B', 3}, {1, 'C', 4}, {1, 'D', 5},
- {2, 'E', 2}, {2, 'I', 0},
- {3, 'F', 3}, {3, 'J', 0}, {3, 'M', 4},
- {4, 'G', 4}, {4, 'K', 0},
- {5, 'H', 5}, {5, 'L', 0}, {5, 'O', 2}, {5, 'N', 4},
- {0, 0, 0}
- };
- Fsm fsm(graph);
- fsm.Reset();
- int index = 0;
- fsm.Advance(input_string[index++]);
- while (!fsm.EndState() && !fsm.DoomState())
- fsm.Advance(input_string[index++]);
- if (fsm.EndState())
- printf("\nValid input expression");
- else
- printf("\nInvalid input expression");
- }
- int main()
- {
- test_fsm();
- system("pause");
- }
当然也可以将上述程序中的转换表不放在主程序中,而是由一个派生自Fsm的子类SpecificFsm提供,在SpecificFsm中设置具体的转换表,然后通过SpecificFsm的初始化列表传到基类Fsm中,这样在主程序中就可以使用SpecificFsm来进行操作了。