世界上有这么多种语言,自然语言如汉语、英语等, 编程语言如C++,Java,Python 等。那么这些语言有什么共性和不同呢?
共性:
- 都由一些字符组成
- 字符组合都有一定的语法规则(符合规则的才是合法的)
不同:
- 不同的语言由不同的基本字符组成
- 不同的语言语法规则不同,例如中文有主谓宾结构,编程语言里不存在
那么,怎么去描述一个语言的语法规则呢?换句话说,一个语言是怎么产生的呢?
上下文无关文法
首先介绍几个概念, ∑ \sum ∑ 记为一个字符集合, ∑ \sum ∑中任意字符的拼接记为一个字, ∑ ∗ \sum^* ∑∗记为由 ∑ \sum ∑中字符拼接而成的字的集合,其中不包含任何字符的字,记为 ϵ \epsilon ϵ。
例如 ∑ = { a , b } \sum = \{a, b\} ∑={ a,b},则 a a , a a a , b , a b aa, aaa, b, ab aa,aaa,b,ab都是 ∑ \sum ∑的一个字。 ∑ ∗ = { ϵ , a , b , a a , a b , b a , b b , . . . } \sum^*=\{ \epsilon, a, b, aa, ab, ba, bb, ...\} ∑