Parsing Techniques 读书笔记 第2章

      文法有两个层次:Sentence/word和word/letter。而一个好的文法总要能够很好的区分这两个层次。前者以token为不可再分单位,而后者以letter为不可再分单位。

正式语言学家眼中的语法: 语法是任何语言的确定的、有限大小的、完整的描述,即句子的集合。但有些波拉图式的很抽象的描述比如 “这是史塔克写的语言”或“这个语言包含了Π中的所有数字组合集合”,这种描述非常广泛,但越通用意味着越难以利用,毕竟总不可能凭借“史塔克写的语言”去对这个语言进行各种精确的操作吧。所以正式语言学家不得不放弃这种“诱人而懒散”的概念,转向衍生语法(generative grammar),衍生语法成为形式语言中的主流,其中以乔姆斯基为代表,而衍生文法就是通过有限规则和初始元素来构造和描述语言。

 

所有的语言都能通过有限集构造吗?

答案为,可以用康托尔对角论证法来证明。2.1.3.2节首先介绍了用穷举法来描述语言;2.1.3.3节中通过基于符号表∑的两种语言*∑和L的对比,将语言的描述从穷举变换成二进制的描述(从而引入了数学的领域),再利用对角论证法,论证了语言不可能完全被描述。感觉这和哥德尔定理的证明有很多相似之处,涉及到了自我指涉,如果有兴趣,可以参考如下这个帖子,用对角论证法将停机问题、哥德尔不完备定理等问题联系在了一起:

https://blog.csdn.net/pongba/article/details/1336028

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值