我的中文句法分析器

我的中文句法分析器

鉴于上次“如此开源”之痛,所以花了几天时间,边看《诛仙》边完成了一个通用的中文句法分析器,采用Earley的Chart Parsing算法,当然也基于我强大的中文分词标注一体化系统。偶然想到在这个一体化系统上再融合进句法分析,实在是一个不错的升华想法,不过还没有弄到Penn Chinese Treebank的训练语料,所以还没法做概率句法分析,等有机会吧。还要抽时间把我的sourceforge目录整理一下才行,或许可以在适当的时候把整个句法分析的源码传上去,不过要写好详细的文档又不在计划中,所以也不知道又要拖到啥时候,这似乎有点像萧大写《诛仙》的速度了,呵。

有人问到我的sourceforge目录地址,我这里只有暂时说抱歉,以前的确打算在sourceforge上建立一个中文句法分析的project,但是
因为我的中文句法分析器其实始终是以模块形式置于别的系统中使用的,主要是用来训练和抽取所需的数据,以达到一定程度上句法信息的引入,并没有做成一套单纯的句法分析系统,毕竟工作的我还是以应用为需求来设计和开发东西。如果将来我重返学校的话就可以把我所实现的所有语言处理模型都open source,毕竟这是我一直以来的追求。

对于句法分析而言,Chart Parsing算法很有效,但只是一个小东西,如果把输入进行简化,直接输入人工标注和分好词的数据,把句法规则定义得简单一点,那么实现一个简单的句法分析也就几百行代码的事情。如果有同学也在试图书写这样的代码的话,我还是希望其可以自己动一下手,从简单的开始,逐步积累经验,毕竟自然语言处理技术还是大有可为的。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值