自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

搜索如风

期待一种令人叹为观止的智能搜索技术,搜你所想

  • 博客(4)
  • 收藏
  • 关注

原创 我的中文句法分析器

鉴于上次“如此开源”之痛,所以花了几天时间,边看《诛仙》边完成了一个通用的中文句法分析器,采用Earley的Chart Parsing算法,当然也基于我强大的中文分词标注一体化系统。偶然想到在这个一体化系统上再融合进句法分析,实在是一个不错的升华想法,不过还没有弄到Penn Chinese Treebank的训练语料,所以还没法做概率句法分析,等有机会吧。还要抽时间把我的sourceforge目录

2006-03-22 16:12:00 10657 18

原创 如此开源

听说哈工大和计算所有句法分析开源,满怀欣喜地想借鉴一下研究之作,却没想其层层设限,根本无从下载。大悟,原来这就是他们所谓的开源!揣想我们中文自然语言处理的举步不前,难道和这些可笑的“敝帚自珍”之举毫无关系吗?其实即算能够付诸实用的句法分析器也不过是个小的cookie而已,谈何以怕人商用而徒加屏障呢,须知商用的东西比之高校个人之作而言要有太多的讲究,真是可笑。愤怒之余,亦是无奈,只得愈加努力,希

2006-03-09 18:16:00 12766 46

原创 灵感就是灵感

面对分词系统中的命名实体识别已经很难下手提高精度,中断了一段时间去做完了一个有趣的拼音输入法,在快撰写完相关专利申请文稿的时候,又有些百无聊赖了,想想下面又要回去面对那个代码似乎已经很漂亮而精度却难于提升的分词标注系统,一片空白。自然语言处理行当就是如此,总会遇上难题,很愁,又难以绕过,只能冥思苦想。好多天来,我都近乎无可奈何,这种状态会让我觉得空虚度日。昨天博士问我下面NER怎么进行,我敷衍说先

2006-03-08 12:52:00 1560

原创 松驰之道

前些日子下班时候,在一处拥挤难行的街道因为用力过猛,竟然把自行车链条给扯断了,最后只好拾起链条推着车回去。周末去修车,师傅说链条太短,估计是断了一截,当时我就耐闷,难道我骑车都用这么大力吗?不过链条看来明显是短了,就只好使用后齿轮的最小圈,不过这样也只是比以前降低了一个档位而已。按照我的计划是,刚开始时前齿轮使用中间档位,后齿轮使用中间档位,2个月后把后面的换为次小档位,然后又过了2个月后前面开始

2006-03-02 18:22:00 1615

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除