自然语言处理(一)——文法(形式语言)基本概念

本文介绍了形式语言的基本概念,包括字符串、连接、乘积和闭包,并详细阐述了形式文法的定义,如4元组G=(N, Σ, P, S)。通过举例说明非终结符N、终结符Σ、产生式P和开始符S的含义。最后,讨论了文法生成的句子和语言的概念。" 122717410,11599984,Python实现双向链表解决自行车停放问题,"['链表', '算法', 'python']
摘要由CSDN通过智能技术生成

一、基本概念

1.字符串:假定 Σ 是字符的有限集合,它的每一个元素称之为字符。由 Σ 中字符相连而成的有限序列被称之为Σ上的字符串。

这是教材对于字符串的定义,通俗地理解,字符串就是一连串的字符。不包括任何字符的字符串称为空串,记作 ε。

包括空串的 Σ 上字符串的全体记为 Σ*。例如Σ=abcd。 Σ*可以理解为a、b、c、d这四个字符的任意组合再加上空串ε的集合。

2.字符串的连接:例如 x=abc,y=def。x和y连接记作xy=abcdef。x和x自身连接,记作x的平方,同理n个x连接记作x的n次方

3.字符串集合的乘积:设A, B是符号串的集合,则A, B的乘积定义为:AB = {xy | x ∈ A, y ∈ B}。

   例如 设A={aa, bb}, B={cc, dd, ee},则 AB={aacc, aadd, aaee, bbcc, bbdd, bbee}

4.字符串集合的闭包:如果V是字符表Σ上的字符串集合,那么V 的闭包定义为:V* = V0 ∪ V1∪ V2 ∪ …

例如:V = {a, b}

V0 = {ε},V1 = {a,b},V2 = {aa,ab,ba,bb},V3={aaa,aab,...}

V* = {ε, a, b, aa, ab, bb

  • 3
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值