再谈编译原理学习1

最新推荐文章于 2021-05-28 21:54:52 发布

使我做你和平之子

最新推荐文章于 2021-05-28 21:54:52 发布

阅读量874

点赞数

分类专栏：编译原理文章标签： compiler 编译器 token 工具代码分析正则表达式

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hzzasdf/article/details/6112173

版权

编译原理专栏收录该内容

2 篇文章 0 订阅

订阅专栏

编译原理是我最头疼的科目之一。先后学了3次，都没有真正理解（却还大言不惭地写了点“体会”），现在算是第4次学。计算机学到现在，最深的体会就是什么东西都只有自己动手做一遍，方才有真正的理解。现在，编译原理方面的实践还很少，所以理解也还很浅，只能

谈些自己的学习经历。

目前在看的教材是Compiler Design in C。这本书最大的优点是提供了完整的编译器代码，但是，是用C写的，而我C的基础很差，平时

工作中用的也是C#。不过，C程序写不来，看还看得懂一些。硬着头皮看下去，目前正在看词法分析的将NFA转成DFA的部分。

另外，利用现成的C#语法和Antlr工具，做了个简单的代码分析工具（统计每个类和方法里有几行代码，几行注释语句等），以及利用在方法的开始和结束处插入语句来检测性能的小工具。

还看了一部分Antlr本身的代码和它生成的编译器的代码，基本上是一头雾水。

Compiler Design in C这本书第一章提供了一个简单的编译器代码，我把它用C#改写了一下。也许以后碰到简单的应用也可以用得上。

由于该书出版较早，有些知识已经过时。比如，输入子系统，它用了一个分段读入数据的缓冲系统，这当然和当时的硬件条件有关。我看老版本的Antlr代码时，似乎也用了个类似的首尾相连的环型结构来做缓冲（因为Java无指针)，但新版的代码里，干脆用个大数组，把字符一次性全部读入。

这个简单的编译器代码，parser在需要一个token时，才调用lexer读入一个token，而Antlr的代码里，在parser第一次调用lexer时，就把所有的token都提取出来了。也许这样的效率高些。

词法分析时，构建NFA，Compiler Design in C里似乎是从正则表达式直接去转的，而Antlr则是从抽象语法树去转的，也许这样更方便。

简单的词法分析，其实完全可以硬编码，手写。现在觉得，似乎NFA, DFA这些东西，主要是为了适合lex之类的自动工具，而实际工作中，复杂一些的情况，可能都是用工具来生成，而不会手工去实现NFA,DFA等。学这些东西，也许主要是为了“知其所以然”，以及学一些思想(比如DFA转换表似乎可在一些和状态有关的问题中得到应用)，具体实现倒似乎不一定用得到。

以上是学习至此的一些记录。现在真正知道，学点东西，要付出相当的功夫才行。随着学习的进展，以后陆续再写点体会和感想。

使我做你和平之子

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。