计算理论是计算机应用的基础,理论和应用缺一而不可。
---- 目录 ----
C01 自动机
C02 有穷自动机
C03 正则表达式与正则语言
C04 正则语言的性质
C05 上下文无关文法及上下文无关语言
C06 下推自动机
C07 上下文无关语言的性质
C08 图灵机
C09 不可判定性
C10 难解问题
C11 其他问题类
---- C01 自动机 ----
- 有穷自动机(FA)的两个重要因素是状态和跳转,状态是数据/环境,跳转是函数/响应。
- 自动机的结构表示法有两种,一种是正则表达式,正则表达式(RE)和有穷自动机(FA)是等价的,前者只是后者的结构记号而已,另一种是文法,通常指的是上下文无关文法,用来构建编译器的语法分析器。
- 可判定性是研究计算机能做什么不能做什么的,计算机能解决的问题称为“可判定的”,反之则为“不可判定的”,难解性是指问题的解决难度是容易的还是复杂的,复杂度为多项式的问题称为“易解的”/“可计算的”(P问题),反之则为“难解的”/“不可计算的”(NP问题)。
- 证明分为演绎证明和归纳证明,演绎证明是基于推导(前提->结论)的命题树,“如果那么”是单向的,“当且仅当”是双向的,命题当且仅当逆否命题(若A则B<->若非B则非A),反证法(证明A与非B矛盾)就是基于此的,反例法是用来推翻错误命题的,归纳证明分为基础部分/初始部分(S(0)成立)和归纳部分/推导部分(S(n)成立->S(n+1)成立),结构归纳法是基于递归定义的,所谓的“结构”是指某个递归定义的结构。从哲学上认为,演绎法和归纳法是两个不同的过程,前者是从一般到个别的应用过程,后者是从个别到一般的总结过程,而我们这里强调的演绎是寻找前提和结论之间的联通路径,归纳是从部分到整体、从容易到困难的递归推导。
- 自动机理论的中心概念有字母表、串和语言,字母表(A)是字母的集合,串(S)是字母的序列,语言(L)是串的集合,判定问题是判定某个串是否属于某个语言的问题,语言和判定问题其实是相同的东西,它们都划出了“是”与“不是”的界线。
---- C02 有穷自动机 ----
- 有穷自动机(FA)是基于状态和控制的,“控制”是制定状态跳转的规则,控制有“确定的”(只有一个状态)和“非确定的”(可以多个状态),所以有穷自动机有确定型有穷自动机(DFA)和非确定型有穷自动机(NFA)两种,正则表达式是有穷自动机的代数记号,它与有穷自动机是等价的,正则语言是描述有穷自动机的语言。
- 确定型有穷自动机(DFA)由有穷个状态的集合(Q)、有穷个输入符号的集合(A)、转移函数(T)、初始状态(q0)和接受状态的集合(F)五部分组成,DFA可以用数学公式描述:DFA=(Q, A, T, q0, F),也可以用转移图和转移表描述,转移函数是基于某个输入符号的,扩展转移函数是基于某个输入符号序列的,DFA的语言L(DFA)={S|T(q0,S)属于F},输入一个符号序列,DFA可以接受或拒绝(判定性)。
- 确定型有穷自动机(DFA)只有一个状态,而非确定型有穷自动机(NFA)可以多个状态,从而具备了一定的“猜测”能力。与DFA一样,NFA也是由五部分组成,只是转移函数T的返回是状态的集合(DFA的只是一个状态),也就是说,DFA只是NFA的一个特例而已,在设计上NFA会比DFA更加简单和自然,NFA的语言L(NFA)={S|T(q0,S)与F的交集非空},NFA与DFA是等价的(也即是L(NFA)等价于L(DFA)),通过子集构造,我们可以把NFA的状态集合作为DFA的状态,把NFA转为为等价的DFA,但换来的是指数增长的状态数,我认为两者等价应该取其较简者,在设计上,如果缺少转移,可以额外添加一个“死状态”。
- 带ε的非确定型有穷自动机(ε-NFA)是NFA的一个变种,ε指的是空串,它提供了很大的便利性,ε-NFA与NFA的不同也在于转移函数上,ε-NFA的转移函数可以接收ε作为输入符号(允许空输入),从状态q出发通过ε转移能够到达的所有状态的集合称为状态q的ε闭包(或ε闭集)(ECLOSE(q)),通过融合了ε闭包的子集构造,我们可以看到ε-NFA与DFA其实也是等价的。
- 有穷自动机的理论最初来源于神经网路的研究,研究神经网络可能有助于发现比有穷自动机更为复杂的模型。
----