搞了几天Yacc了 前两天写了个简单的。 今天见了苏老师 他给我很多很好的意见 再附加一篇论文(晕,上个星期的我还没看咧)。
对于人名识别和提取确实是个计较复杂的领域,但是我的FYP当中用到人名识别,所以只有找现成的工具和源码了。找到中文名的ICTCLAS,一个中科院开发中文分词系统 如果简单的分词和人名识别带了源码。(这部分我可以用啊)可是是VC6.0。苏说最好是通用的C(指Broland C 或DC 能用的?)。不知道我能不能改过来,因为它是MFC写的,我以前想学MFC找不到时间。唉。。。
如果要有Libs就什么编译环境不用愁了。可是要 1200 RMB。
另外他说ICTCLA 和yacc 达到协调和同步很重要,我想了一个,他想了两个。解释是我弱项,他听不太懂。而他的我也比较模糊。看看吧,他的草稿我也带回来了。。。
学Yacc,就是看懂Yacc我也用了很久时间,下了十多份资料看。当然迫使我这样的是根本网上找不到现成的code....痛苦的几天.....
另外中文字很特别 一个中文字占2 bytes ,另外也给全角和半角字符整了一下 啊 天啊
什么堆栈,shift-reduce 冲突,优先权,语法树,正则表达式,啊 头好晕 。。。嗯,至少已过去了
PS:苏说UIC没开过编译原理课是 有点问题 他想把下学期的Database implement 改为编译原理
Resource:
lex&yacc 教程 带例子
下载
http://download.csdn.net/source/538962