【形式语言】第一章绪论

最新推荐文章于 2022-11-17 23:22:31 发布

加油加油再加油x

最新推荐文章于 2022-11-17 23:22:31 发布

阅读量408

点赞数 1

分类专栏：形势语言

本文链接：https://blog.csdn.net/weixin_43325134/article/details/108635553

版权

形势语言专栏收录该内容

1 篇文章 1 订阅

订阅专栏

集合

集合：一定范围内的、确定的、并且彼此可以区分的对象汇集在一起形成的整体叫做集合(set)，简称为集(set)
元素：集合的成员为该集合的元素(element)
基数：集合中元素个数
集合的描述形式有列举法和命题法两种

集合的运算

并( $\cup$ )
交( $\cap$ )
差( $-$ )
对称差( $\oplus$ )
笛卡尔积( $\times$ )
$A\times B =\{ (a,b) | a \in A \& b \in B\}$
幂集( $2^A$ )
所有集合子集(包含本身和空集)
补集( $\overline A$ )

令A = {1,2,3},B = {2,3,4},U = {1,2,3,4}
则 $A\cup B=\{1,2,3,4\},A\cap B=\{2,3\},A-B=\{1\},A\oplus B=\{1,4\},A\times B = \{(1,2),(1,3),(1,4),(2,2),(2,3),(2,4),(3,2),(3,3),(3,4)\},2^A=\{\empty , \{1\},\{2\},\{3\},\{1,2\},\{1,3\},\{2,3\},\{1,2,3\}\},\overline A = \{4\}$

关系

二元关系

二元关系：任意的 $R\subseteq A\times B$ ，称 $R$ 为 $A$ 到 $B$ 上的二元关系。
表示： $(a,b)\in R$ 也可表示为 $a R b$
两个域：A称为定义域，B称为值域
当 $A = B$ 时称 $R$ 为 $A$ 上的二元关系

几种二元关系性质

自反性 2.反自反 3.对称性 4. 反对称性 5. 传递性
ps:对称和反对称并不是互斥的

等价关系与等价类

等价关系：具有自反性、对称性、传递性的二元关系称为等价关系。
等价类： $S$ 的满足如下要求的划分： $S_1$ 、 $S_2$ 、 $S_3$ 、…、 $S_n$ 、…称为S关于R的等价划分， $S_i$ 称为等价类。
(1) $S_1\cup S_2\cup S_3\cup...\cup S_n\cup...$
(2)如果 $i\not =j$ ,则 $S_i\cap S_j = \empty$
(3)对于任意的 $i$ ， $S_i$ 中的任意两个元素 $a$ 、 $b$ ， $a R b$ 恒成立。
(4)对于任意的 $i$ ， $j$ ， $i\not =j$ ， $S_i$ 中的任意元素 $a$ 和 $S_j$ 中的任意元素 $b$ ， $a R b$ 恒不成立

关系的合成

设 $R_1\subseteq A\times B$ 是 $A$ 到 $B$ 的关系、 $R_2\subseteq B\times C$ 是 $B$ 到 $C$ 的关系， $R_1$ 与 $R_2$ 的合成 $R_1R_2$ 是 $A$ 到 $C$ 的关系：
$R_1R_2= \{(a,c)|\exists(a,b)\in R_1且(b,c)\in R_2\}$

关系的闭包

设P是关于关系的性质的集合，关系R的P闭包(closure)是包含R并且具有P中所有性质的最小关系。

正闭包(传递闭包)

(1) $R\subseteq R^+$ 。
(2)如果 $(a, b)$ ， $(b,c)\in R^+$ ,则 $(a，c)\in R^+$ 。
(3)除(1)、(2)外， $R^+$ 不再含有其他任何元素。
具有传递性
对于任意的关系R，有
$R^+ = R\cup R^2 \cup R^3\cup ... \cup R^n \cup ....$
当S为有穷集(元素所属于的集合)时，有
$R^+ = R \cup R^2 \cup R^3\cup ... \cup R^{|S|}$
提供一种求出 $R^+$ 的一套算法（S为有穷集时，这是我自己想的，还没有证明）
step1：
求出 $R^2$ ，令 $\Delta R = R^2-R,R = R^2\cup R$
step2：
$\Delta RR\cup R\Delta R$
$\Delta R' = R' - R$
$R\cup R'$
若 $\Delta R'==\empty$ ，则结束算法，此时 $R^+==R$
若 $\Delta R'\not=\empty$ ，则令 $\Delta R=\Delta R'$ ，转step2
PS：“=”均表示赋值

# python代码实现
def getmutify(set1,set2):
	s = set()
	for item1 in set1:
		for item2 in set2:
			if item1[1] == item2[0]:
				s.add(item1[0]+item2[1])
	return s

def getPositiveClosure(R):
	R_2 = getmutify(R,R)
	detR = R_2 - R
	R = R.union(R_2)
	while True:
		Rc = getmutify(detR,R).union(getmutify(R,detR))
		detRc = Rc - R
		R = R.union(Rc)
		if len(detRc) == 0:
			return R
		detR = detRc

s = getPositiveClosure({"ab","bb","bc"})
print(s) #{'ac', 'ab', 'bc', 'bb'}

克林闭包

(1) $R^0\subseteq R^*,R\subseteq R^*$ 。
(2)如果 $(a, b)$ ， $(b,c)\in R^*$ ,则 $(a，c)\in R^*$ 。
(3)除(1)、(2)外， $R^*$ 不再含有其他任何元素。
具有自反性、传递性

语言

语言：某个集合中的元素，按照规则组合成的符号串的集合。
形式语言理论：用数学方法，对语言的表示法、结构及特性进行研究的理论。
（1）怎么构造语言
（2）怎么识别语言
（3）怎么去分析语言的含义
自动机理论：克林在研究神经细胞中，建立了识别语言的系统——有穷状态自动机。
（1）文法与自动机是等价的。
（2）文法与自动机的运算对象：集合。

基本概念

1.字母表：字母表是一个非空有穷集合，字母表中的元素称为该字母表的一个字母(letter)。又叫做符号(symbol)、或者字符(character)。通常用 $\sum$ 符号表示。
字符两个特性
（1）整体性，也叫不可分性。
（2）可辨认性，也叫可区分性。
2.字母表的乘积：
$\sum_{1}\sum_2=\{ab|a\in \sum_1,b\in \sum_2\}$
个人感觉类似于笛卡尔乘积。
3.字母表 $\sum$ 的 $n$ 次幂
$\sum^0=\{\varepsilon\}$
$\sum^n=\sum^{n-1}\sum$
其中， $\varepsilon$ 是由 $\sum$ 中的0个字符组成的。 $|\{\varepsilon\}|=1$ , $|\varepsilon|=0$ 。
4. $\sum$ 的正闭包和克林闭包
$\sum^+=\sum\cup \sum^2\cup \sum^3\cup...$
$\sum^*=\sum^0\cup\sum^+$
正闭包和克林闭包都是集合。其中，正闭包是由 $\sum$ 中至少一个字符连接而成，而克林闭包可以不含 $\sum$ 中的字符。
5.句子
$\sum$ 是一个字母表， $\forall x\in \sum^*$ ， $x$ 叫做 $\sum$ 上的一个句子。
6.句子的长度
$\forall x\in \sum^*$ ，句子 $x$ 中字符出现的总个数叫做该句子的长度，记作 $∣ x ∣$ 。
7.并置
$x,y\in\sum^*$ ， $x$ ， $y$ 的并置是由串 $x$ 直接相接串 $y$ 所组成的。记作 $x y$ 。并置又叫做连结。
8.串x的n次幂
$x^0=\varepsilon$
$x^n = x^{n-1}x$
9.前缀和后缀
设 $x$ ， $y$ ， $z$ ， $w$ ， $v\in\sum^*$ ，且 $x = y z$ ， $w = y v$
(1) $y$ 是 $x$ 的前缀，若 $|z|\not = 0$ ，则称 $y$ 为 $x$ 的真前缀
(2) $z$ 是 $x$ 的后缀，若 $|y|\not = 0$ ，则称 $z$ 为 $x$ 的真后缀
(3) $y$ 是 $x$ 和 $w$ 的公共前缀
(4)如果 $x$ 和 $w$ 的任何公共前缀都是 $y$ 的前缀，则 $y$ 是 $x$ 和 $w$ 的最大公共前缀
(5)如果 $x = z y$ ， $w = v y$ ，则 $y$ 是 $x$ 和 $w$ 的公共后缀
(6)如果 $x$ 和 $w$ 的任何公共后缀都是 $y$ 的后缀，则 $y$ 是 $x$ 和 $w$ 的最大公共后缀
10.子串
$w$ ， $x$ ， $y$ ， $z\in \sum^*$ ，且 $w = x y z$ ，则称 $y$ 是 $w$ 的子串。
(1) $t$ ， $u$ ， $v$ ， $w$ ， $x$ ， $y$ ， $z\in\sum^*$ ，且 $t = u y v$ ， $w = x y z$ ，则称 $y$ 是 $t$ 和 $w$ 的公共子串。如果 $y_1$ ， $y_2$ ，……， $y_n$ 是 $t$ 和 $w$ 的公共子串，且有 $y_j|=max\{|y_1|,|y_2|,…,|y_n|\}$ ，则称 $y_j$ 是 $t$ 和 $w$ 的最大公共子串。
PS：两个串的最大公共子串不一定是唯一的。
11.语言
$\forall L\subseteq \sum^*$ ， $L$ 称为字母表 $\sum$ 上的一个语言， $\forall x\in L$ ， $x$ 叫做 $L$ 的一个句子。
12.语言的乘积
$L_1\subseteq \sum_1^*$ ， $L_2\subseteq \sum_2^*$ ，语言 $L_1$ 与 $L_2$ 的乘积是一个语言，该语言定义为：
$L_1L_2=\{xy|x\in L_1,y\in L_2\}$ 是字母表 $\sum_1\cup \sum_2$ 上的语言。

加油加油再加油x

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
【形式语言】第一章绪论

集合集合：一定范围内的、确定的、并且彼此可以区分的对象汇集在一起形成的整体叫做集合(set)，简称为集(set)元素：集合的成员为该集合的元素(element)基数：集合中元素个数集合的描述形式有列举法和命题法两种集合的运算并(∪\cup∪)交(∩\cap∩)差(−-−)对称差(⊕\oplus⊕)笛卡尔积(×\times×)A×B={(a,b)∣a∈A&b∈B}A\times B =\{ (a,b) | a \in A \& b \in B\}A×B={(a,b)∣a
复制链接

扫一扫